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内 容 提 要 
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用 性 的 同时 ， 突 出 了 应 用 方法 与 理论 的 结合 . 书 中 的 正文 和 习题 中 都 提供 了 大 量 的 实际 案例 ， 
书 中 最 后 有 许多 统计 用 表 以 及 奇数 号 习题 解答 和 术语 索引 . 
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非 参 数 统计 方法 中 一 个 诱 人 的 特性 是 : 你 并 不 需要 成 为 一 个 概率 论 方面 的 专家 
就 能 理解 非 参 数 方法 所 蕴含 的 理论 ， 只 要 掌握 了 一 些 易学 的 基本 概念 ， 非 参数 方法 
的 基本 理论 很 容易 被 理解 ， 本 章 介绍 这 些 基本 概念 ， 所 需要 的 只 是 耐心 、 信 心 和 较 
好 的 高 中 代数 知识 

这 本 书 是 这 样 安排 的 ， 读 者 可 以 直接 找到 所 需要 的 统计 方法 ， 然 后 从 头 到 尾 一 
步 一 步 按 着 说 明 操作 ， 然 而 如 果 这 样 的 话 ， 不 一 定 能 知 其 然 更 不 能 知 其 所 以 然 ， 从 
而 通常 导致 错 误 处 理 了 数据 和 得 出 不 合理 的 结论 ， 在 第 1、2 章 ， 读 者 应 该 全 面 理解 
所 使 用 的 非 参 数 方法 ， 甚 至 能 对 其 稍 作 修改 ， 使 它 能 更 好 地 应 用 于 所 分 析 的 特殊 数 
据 集 

对 学 习 每 一 节 的 建议 ; 通读 教材 ， 然 后 演算 例子 ， 最 后 做 每 一 节 后 的 习题 和 思 
考题 ， 这 样 可 以 为 下 一 节 的 学 习 做 准备 ， 也 可 以 增强 前 面 所 提 到 的 耐心 和 信心 . 


计算 概率 的 过 程 通常 依赖 于 计数 ， 如 通常 的 计数 ,“1、2、3” 等 等 ， 而 通常 的 
计数 方法 在 一 些 复杂 的 情形 下 将 变 得 十 分 元 长 乏味 ， 所 以 本 节 介 绍 一 些 有 技巧 性 的 
计数 方法 ， 用 于 处 理 这 种 复杂 的 情形 . 

掷 一 枚 硬币 时 ， 我 们 仅 考 虑 2 种 可 能 的 结果 : 或 者 出 现 正面 (H)， 或 者 出 现 反 
im (T)、 如 果 掷 一 次 ， 可 能 出 现 2 种 结果 : H sk T; 如 果 掷 两 次 ， 会 出 现 4 种 可 能 : 
HH,HT,TH,TT， 其 中 HT 表示 掷 第 1 次 时 出 现 也 ， 掷 第 2 次 时 出 现 T， 每 多 掷 一 次 ， 
则 可 能 出 现 的 结果 数 将 是 原来 的 2 倍 ， 因 为 最 后 一 次 投掷 总 有 2 种 可 能 的 结果 . 所 
LL, WRR n 次 硬币 ,结果 会 出 现 2" 种 可 能 . 


试验 


为 讨论 一 般 化 ， 我 们 把 毛 硬 币 作为 试验 的 一 个 例子 ， 无论 是 毛 一 次 、 两 次 还 是 n 
次 ， 这 个 过 程 都 被 看 作 是 一 个 试验 ， 这 样 投掷 3 次 硬币 也 是 一 次 试验 ， 它 是 3 AAR 
一 次 硬币 的 独立 试验 的 组 合 ， 我 们 称 较 短 的 试验 为 基本 试验 ,“ 试 验 ” 由 基本 试验 组 
合 而 成 .一 般 来 说 ， 一 个 试验 是 遵循 一 套 已 设计 好 的 规则 的 过 程 ， 试 验 前 并 不 知道 
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遵循 这 些 规 则 的 最 终结 果 . 
模型 


很 少 人 会 认真 地 考虑 掷 硬币 作为 一 个 试验 其 自身 所 具有 的 价值 . 实际 上 ， 掷 硬 
币 的 价值 在 于 它 为 许多 不 同情 况 下 的 不 同 模型 提供 了 原型 ， 如果 我 们 考虑 的 是 一 个 
均匀 硬币 ， 即 每 一 面 出 现 的 可 能 性 是 一 样 的 ， 这 个 试验 就 与 下 面 的 试验 类 似 : 老鼠 
对 于 两 个 门 的 选择 ;顾客 对 两 种 商品 的 选择 ; 教师 判断 两 种 教学 法 方法 哪 种 更 有 效 ; 
市 场 分 析 家 预测 周一 行情 将 是 看 涨 还 是 走 跌 等 等 . 

如 果 硬 币 是 不 均匀 的 ， 即 一 面 比 另 一 面 更 容易 朝 上 ， 这 种 模型 将 适用 于 更 广泛 
的 一 类 试验 ， 例 如 : 给 老鼠 的 血液 注射 药物 来 检验 这 种 药物 是 否 是 致命 的 ; 找 病人 
来 检验 一 种 新 的 治疗 法 ; 消费 者 从 几 种 产品 里 选 购 一 种 ， 这 些 产 品 中 只 有 一 种 是 由 
某 公司 制造 的 等 等 ， 每 种 情况 我 们 关心 的 结果 只 有 两 个 ， 如“ 生 ” 或 “ 死 "，“ 痊 
愈 ” 或 “未 竣 愈 ”,“ 某 公司 的 品牌 ”或 “其 他 品牌 ”"， 两 种 结果 发 生 的 可 能 性 不 必 
相等 . 

ERATA, RIERREN, WET. AEREE, KRKA PE 
几 种 有 价值 的 模型 ， 其 价值 在 于 它们 是 大 量 复 杂 模 型 的 简单 而 实用 的 原型 ， 这 些 复杂 模 
型 来 自 电子 物理 、 心 理学 、 社 会 学 、 教 育 学 、 生 物 学 、 经 济 学 、 化 学 等 许多 不 同 领域 的 
实验 ，Feller(1968) 很 好 地 研究 了 这 些 模 型 的 差异 性 ， 这些 内 容 本 章 先 做 部 分 介绍 ， 因 
为 需要 其 他 非 参数 方法 的 知识 ， 所 以 大 部 分 说 明 要 放 到 后 面 的 几 个 章节 中 . 


事件 


这 样 ， 我 们 把 掷 硬币 作为 一 个 试验 ， 并 把 每 一 次 投掷 作为 一 个 基本 试验 ， 把 一 
个 或 多 个 基本 试验 或 整个 试验 的 结果 称 为 事件 〈event)， 刚 描述 的 掷 硬币 试验 包含 n 
个 基本 试验 ， 其 中 每 个 基本 试验 的 结果 是 事件 “H” 或 “T”". 事件 的 组 合 本 身 也 是 
一 个 事件 ， 所 以 试验 中 2 个 可 能 结果 的 每 一 个 都 可 以 看 作 一 个 事件 ， 其 他 事件 的 例 
子 有 “至 少 一 次 正面 朝 上 ”、“ 第 4 次 反面 朝 上 ”、“ 正 面 朝 上 的 次 数 至 少 是 反面 朝 上 
的 两 倍 ” 等 等 . 

推 而 广 之 ， 可 得 如 下 准则 : 

准则 1. 1. 1 如果 一 个 试验 包含 个 基本 试验 ， 且 每 一 个 基本 试验 有 大 种 可 能 的 
结果 ， 则 整个 试验 有 kk 个 可 能 的 结 采 . 

例 1.1.1 

如 果 一 个 试验 由 7 个 基本 试验 组 成 ， 每 个 基本 试验 是 向 3 个 盒子 之 一 投 一 个 球 . 
第 一 次 投 会 产生 3 个 不 同 的 结果 ， 前 两 次 投 共有 3” =9 种 可 能 的 结果 . 这样 推 广 
到 由 7 次 投掷 组 成 的 试验 ， 它 的 试验 结果 就 有 3 =2187 种 不 同 的 可 能 . m 

现在 ， 考 虑 一 个 盒子 装 有 个 筹码 ， 筹 码 编号 从 1 到 n， 从 盒子 中 先 取 出 一 个 筹 
码 放 到 桌子 上 ， 可 以 看 到 它 的 编号 ， 这 个 筹码 是 从 n 个 筹码 中 任 取 的 一 个 ， 所 以 有 
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种 方式 .再 从 盒子 中 剩余 的 筹码 中 选取 第 2 个 筹码 ， 并 置 于 第 1 个 筹码 的 旁边 ， 它 的 
编号 也 能 够 看 到 ， 由 于 此 前 盒子 中 只 剩 下 n -1 个 筹码 ， 所 以 第 2 个 筹码 的 选择 有 
n 一 1 种 方式 ， 因 为 选择 第 1 个 筹码 的 n 种 方式 中 的 每 一 种 都 对 应 着 第 2 个 筹码 的 n -1 
种 取 法 ， 所 以 第 1、2 个 筹码 的 选择 共有 n(n -1) 种 方式 ， 第 3 个 筹码 有 nn -2 种 选取 
方式 ， 取 出 后 置 于 桌子 上 的 第 2 个 筹码 旁边 ， 现 在 ,依次 选取 3 个 筹码 共有 n(n - 1) 
(n -2) 种 方式 ， 如 此 继续 下 去 ， 直 至 最 后 一 个 筹码 被 取出 〈 最 后 一 个 筹码 的 选取 只 
有 一 种 方式 ， 因 为 此 时 盒子 中 只 有 1 个 筹码 )， 可 知 从 盒子 中 选取 有 nn 个 编号 的 筹码 
的 方法 有 
n(n — 1)(n — 2): - - (3)(2)(1) = n! (1) 
( 读 作 “的 阶乘 ") 种 方式 ， 或 者 说 把 于 个 不 同 的 物体 排 成 一 行 的 排列 方式 有 mi 
种 ， 为 方便 起 见 ， 我 们 定义 0! =1. 
准则 1. 1.2 n 个 不 同 的 物体 排 成 一 行 ， 其 排列 方式 有 n! 种 . 
例 1.1.2 
考虑 字母 A .B.C 排 成 一 行 的 所 有 排列 数 ， 第 1 个 字母 是 这 3 个 字母 中 的 任意 一 个 ， 
当 第 1 个 字母 选 定之 后 ， 第 2 个 字母 有 两 种 不 同 的 选取 方式 ， 剩 下 的 字母 就 是 最 后 
一 个 选取 的 ， 这 样 一 共有 (3)(2)(1) =6 种 不 同 的 排列 ， 这 6 种 排列 是 ABC 、ACB、 
BAC BCA CAB 和 CBA. = 
例 1.1.3 
假设 一 个 有 8 匹 马 赛马 比赛 .如果 你 能 正确 地 预测 出 哪 匹 马 获得 第 一 ， 哪 匹 马 获得 
第 二 ， 压 上 对 这 个 结果 的 赌注 ， 那 么 你 就 “赢得 正 序 连 赢 "， 假设 你 要 确保 能 赢得 
正 序 连 赢 ， 这 意味 着 你 要 买 (8)(7) = 56 张 彩票 ， 它 们 分 别 对 应 着 产生 第 一 、 二 名 
的 56 种 可 能 的 结果 .整个 比赛 的 结果 ， 即 8 匹 马 的 名 次 排列 ， 共 有 81! =40 320 种 不 
同 的 方式 . 区 
如 果 nn 个 物体 互 不 相同 ， 那 么 这 n! 种 排列 中 的 每 一 种 都 是 唯一 的 . 但 如 果 有 2 
个 物体 相同 ， 那 么 对 于 这 个 物体 的 每 一 种 排列 ， 存 在 另 一 种 排列 的 结果 与 之 一 致 ， 
在 这 两 种 排列 中 ， 其 余 n -2 个 物体 的 位 置 是 一 样 的 ， 只 有 两 个 相同 物体 的 位 置 交 换 
了 .所 以 rn! 种 排列 中 的 每 一 个 排列 都 有 另 一 个 排列 与 它 相 同 ， 所 以 不 同 的 排列 数 是 
n! ⁄2 sk n! /21. | 
假设 其 中 有 3 个 物体 相同 ， 其 余 n -3 个 互 不 相同 .如 果 我 们 把 这 n! 种 排列 按 相 
同 的 排列 分 组 ， 则 在 每 组 中 有 31 个 排列 ， 因 为 由 准则 1.1.2， 三 个 相同 的 物体 在 它 
们 的 三 个 位 置 上 有 31 种 不 同 的 且 无 法 区 分 的 排列 方式 ， 那 么 不 同 排列 的 数目 ， 等 于 
按 相同 排列 分 组 的 组 数 ， 是 n! /3!1. WRA n 个 物体 相同 ， 这 n! 种 排列 按 相同 排列 
分 组 ， 每 组 的 容量 是 n,!。， 如 果 有 nn 个 相同 的 类 型 1 物体 ，n, 个 相同 的 类 型 2 物体 ， 
对 于 类 型 1 物体 的 每 一 种 排列 ， 类 型 2 有 n! 种 相同 的 排列 ， 这 样 每 组 中 排列 方式 相 
同 的 排列 就 有 n,1n,! 种 ， 因 此， 分 得 的 组 数 是 n1 /A(n1n,1)， 这 就 引出 如 下 计数 
准则 : 
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准则 1. 1. 3 ”如果 个 物体 中 及 个 相同 的 第 1 类 物体 ，n 个 相同 的 第 2 类 物 
k,e n, 个 相同 的 第 > 类 物体 ， 则 将 其 排 成 一 行 并 可 以 区 分 的 排列 数 ， 记 作 | ”| 


n n! 
AREY 2 
ni nlna! s fr! 


特别 地 ， 如 果 nn 个 物体 由 个 相同 的 某 类 物体 和 nn-k 个 相同 的 另 一 类 物体 组 成 ， 
那么 这 个 物体 排 成 一行 并 可 区 分 的 排列 数 ， 忆 作 | J. 为 


ny n! 
(u)  kt(n — k)! (63) 


KBAR, MWRKKFN, w|) =o; 显然 ， 不 存在 这 个 物体 的 排列 使 得 其 中 有 多 
T n 个 的 物体 是 一 样 的 . 

为 了 说 明 准 则 1.1.3 的 应 用 ， 我 们 把 这 n! 种 排列 按 相 同 的 排列 分 组 ， 每 组 中 有 
n !n,! n 种 排 法 .因为 任何 一 个 排列 不 会 出 现在 两 个 不 同 的 组 中 ， 所 以 组 数 是 
n!⁄ (n!m leen, 1). AK JEFE, Hik n +n,+- +n =n (n TUEL, KRR 
与 自己 相像 的 物体 ) ， 因 为 1! =1, 方程 (2) 除 以 1 并 不 影响 其 数值 ， 且 准则 1.1.3 
仍然 成 立 ， 可 以 看 出 准则 1. 1.2 是 准则 1.1.3 的 特例 ， 其 中 所 有 n; =1. 

例 1.1.4 

例 1.1.2 计算 了 将 字母 AJ B.C 排 成 一 行 的 排列 有 6 种 方式 ， 现 假设 字母 A 与 B 相 
同 ， 用 字母 X 表示， 则 排列 ABC 和 BAC 记 作 XXC， 是 不 可 区 分 的 . 同样 ACB 和 
BCA 记 作 XCX， 则 最 初 的 3! =6 种 排列 减 为 

(3) 3! _ (3)(2)(1) 


> ) = 1 = P 
种 可 区 分 的 排列 ， 即 XXC、XCX 和 CXX. m= 
例 1.1.5 

将 一 枚 硬币 投掷 5 次 ， 假 定 结果 是 两 次 正面 三 次 反面 . 它们 出 现 的 不 同 顺 序 相 当 于 排 


>: 
列 两 类 物体 ， 一 类 含 2 个 相同 物体 ， 另 一 类 含 3 个 相同 物体 ， on, | =10 这 10 种 排 


列 方式 如 下 ， 其 中 H 表示 正面 ，T 表示 反面 . 

HHTTT THHTT TTHHT HIHTT THTHT 

TIHTH HITHT THTTH TTTHH HTTTH 图 
从 nn 个 物体 中 选取 kk 个 物体 可 以 形成 多 少 组 呢 ? 我 们 用 准则 1. 1.3 来 回答 这 个 问题 . 
假设 个 物体 排 成 一 排 , 将 k 个 相同 的 标记 放 在 这 个 物体 中 的 k 个 上 ， 容 易 看 出 ， 
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这 样 的 放 法 数 ， 等 于 大 个 标记 的 位 置 和 -大 个 未 标记 的 位 置 的 可 辨别 的 排列 数 ， 是 
Hn 
中 这 正 是 准则 1.1.3 所 给 出 的 ， 在 这 种 情况 下 ， [wwe “从 个 物体 中 一 


次 取 k 个 的 取 法 数 ”. 
例 1.1.6 


3 
考虑 字母 A,B,C， 从 中 选取 两 个 字母 的 取 法 有 | | = 种 ， 即 AB.AC 和 BC. 为 了 


与 前 面 的 讨论 联系 起 来 ， 把 三 个 字母 中 的 两 个 用 “*” 标 记 : 

A* B* C 得 到 AB 

A*B C*íH šJ AC 

A B* C* 得 到 BC m 
注意 它 与 例 1.1.4 的 相似 性 . 


二 项 式 系 数 


我 们 介绍 | 的 另 一 种 使 用 方法 考虑 表达 式 (x+y) = (x+Vy) (+y) 
(x +y), 项 是 由 第 一 个 因 式 中 的 x 项 ,第 二 个 因 式 中 的 x 项 …… 直 至 第 个 因 式 中 
的 x 项 相 乘 得 到 的 ，x-'y 项 是 由 n -1 个 因 式 中 的 x 项 相 乘 ， 再 乘 以 一 个 因 式 中 的 y 
项 得 到 的 ， 因 为 y 项 可 以 从 这 n 个 因 式 中 的 任 一 个 选取 ， 所 以 (x +y)" 展开 式 中 及 
项 x'-'y， 同 理 ， 对 于 每 一 个 k 值 ，xy"!* 项 是 从 k 个 因 式 中 选取 k 个 x 项 ， 再 从 其 余 
的 nk 个 因 式 中 选取 n-k 个 y 项 得 到 的 ， 为 得 到 x 项 而 选取 上 个 因 式 的 方法 有 


Biz 其 余 的 因 趟 得 到 的 是 y 项 ， 这 样 在 (+y) 的 展开 式 中 xy"* 项 出 现 了 
k 
[) 次 ， 将 也有 的 展开 项 加 起 来 得 到 : 
EEEE "|= (." |+... 
$ (°) xy"? + (Cs +y" (4) 
n n 
注意 0! =1， maf |=) | j-: 如 果 使 用 记号 
n 
SS 


i=a 


读 作 “i 从 a 到 b, 对 CRA”, (4) 式 可 记 为 


[0] 
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(x $ y)" s pi C) x: n—i (5) 


这 就 是 我 们 熟知 的 “二 项 式 展 开 (binomial expansion)”， 在 很 多 高 中 数学 的 教科 书 
上 都 可 以 找到 它 . 这 也 解释 了 为 什么 “二 项 式 系数 (binomial coefficient) ”常用 来 描 


n 
EE 述 记号 | ] 同 理 ， 在 (x +x, +…+x,)" 的 展开 式 中 yanay" 的 系数 由 “多 项 系数 


( 


multinomial coefficient ) ” | k ] 给 出 . 


例 1.1.7 
利用 二 项 式 展开 来 计算 (2 +3) ， 当 然 ， 我 们 知道 答案 是 5 =625. H (5) 式 中 的 
二 项 式 展开 有 

(2 + 3)! = s. (9 T 


i=0 \! 


_ {4 \ a024 (i)z (3) 2 (4) 23: (i) 
(o) zata (f) 23+ (3) 23+ (4) 23 + (4) 23 


= (1)(1)(81) + (4)(2)(27) + (6)(4)(9) + (4)(8)(3) + (1)(16)(1) 
= 81 + 216 + 216 + 96 + 16 = 625 B 


习题 


用 0 至 9 这 10 个 数字 可 以 组 成 多 少 个 4 位 数 (从 0000 到 9999)? 其 中 每 个 数字 可 以 重复 
多 次 . 

利用 字母 表 中 的 26 个 字母 ， 可 以 得 到 多 少 种 4 个 字母 的 排列 ? 其 中 每 个 字母 可 以 重复 使 
用 多 次 . 


将 字母 L,O,V,E 排 成 有 四 个 字母 的 “单词 ”"， 每 个 字母 只 能 用 一 次 ， 共 有 多 少 种 排 法 ? 
5 个 人 坐 成 一 排 有 多 少 种 坐 法 ? 

从 一 个 12 人 的 俱乐部 中 选取 3 人 组 成 一 个 委员 会 ， 有 多 少 种 选 法 ? 

在 (x+y) 的 展开 式 中 ，x yy 项 的 系数 是 多 少 ? 

在 (x+y +z) 的 展开 式 中 ，xYz 项 的 系数 是 多 少 ? 

在 (w+x+y+z) HERRY, ry 项 的 系数 是 多 少 ? (提示: ly =wxyz) 

Ha S $) 


10， 计 算 > Nie] N 
11， 计 算 2, Ne 日 | 


四 
12， 计 算 2 5. 
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思考 题 


1. 从 第 一 类 中 选取 n 个 物体 ， 从 第 二 类 中 选取 n 个 物体 ， 依 次 进行 ， 从 第 r 类 中 选取 nn, 个 
物体 ， 共 有 和 多少 种 选择 方式 ? 其 中 第 一 类 物体 共有 N. 个 ,第 二 类 物体 共有 N. 个 ， 等 等 . 
如 果 对 于 某 个 in, EN, 大 时 ， 又 有 多 少 情况 呢 ? 


n Jn 
2. ”证明 2 | G (1 -p)" =1. 
t= i 


1.2 概 率 


本 节 将 应 用 1.1 节 中 的 3 个 计数 准则 去 发 现 一 些 有 趣 而 有 用 的 概率 ， 首 先 介绍 一 
些 统计 学 中 的 标准 术语 ， 正 确 理解 本 节 和 其 他 节 定 义 中 的 术语 ， 能 使 我 们 更 容易 理 
解 统计 概念 . 


样本 空间 


我 们 从 试验 出 发 来 定义 重要 的 术语 : 样本 空间 (sample space) 和 样本 空间 中 的 
点 (a point in the sample space). 

定义 1.2.1 样本 空间 是 一 个 试验 中 所 有 可 能 的 不 同 结果 的 集合 . 

定义 1.2.2 样本 空间 中 的 一 个 点 是 一 个 试验 中 一 次 可 能 的 结果 . 

每 个 试验 都 有 其 自己 的 样本 空间 ， 它 含有 这 个 试验 所 有 可 能 的 不 同 结果 ,通常 
假定 样本 空间 可 能 有 一 个 足够 细密 且 合 理 的 划分 ， 其 中 每 一 个 划分 称 为 一 个 点 ， 且 
假定 每 一 个 可 能 的 结果 用 且 仅 用 一 个 点 来 表示 . 


例 1.2.1 
如 果 一 个 试验 为 掷 两 次 硬币 ， 则 样本 空间 中 有 4 个 点 : HH、HT、TH 和 TT. ga 
@J 1. 2. 2 


以 对 一 个 学 生 进 行 10 个 判断 题 的 测试 作为 一 个 试验 ， 每 个 判断 题 答案 为 “对 或 
错 ”， 则 样本 空间 中 有 2”=1024 个 点 ， 每 一 个 点 是 对 这 10 个 连续 问题 可 能 答案 的 
序列 ， 比 如 “TTFTFFTTTT”. = 


事件 


有 了 样本 空间 中 的 点 ， 我 们 可 以 定义 事件 (event). 

定义 1.2.3 一 个 事件 是 样本 空间 中 一 些 点 的 集合 . 

在 例 1.2.1 中 我 们 提 过 “两 次 正面 ”这 个 事件 ， 它 是 由 HH 这 一 个 点 组 成 的 ; 事 
件 “ 一 次 正面 ”含有 TH 和 HT 两 个 点 ; 事件 “至 少 一 次 反面 ”含有 TH，HIT 和 TT 
三 个 点 ; 同样 ， 事 件 “ 四 次 正面 ”中 没有 点 . 通常 称 一 个 没有 点 的 集合 为 空 集 
(empty set)， 一 个 包含 样本 空间 中 所 有 点 的 事件 称 为 必然 事件 (sure event) ， 因 为 每 


ma] 


oo Ps 


次 试验 时 该 事件 必然 会 发 生 . 

两 个 不 同 的 事件 可 能 含有 相同 的 点 ， 事 件 “ 至 少 一 次 反面 ”和 事件 “至 少 一 次 
正面 ”就 有 两 个 相同 的 点 TH 和 HT.， 如 果 两 个 事件 没有 相同 的 点 ， 则 称 它们 为 互 不 
相 容 (mutually exclusive) 事件 ， 因 为 其 中 的 一 个 事件 的 发 生 排 除了 另 一 个 事件 同时 
发 生 的 可 能 . 

如 果 一 个 事件 中 的 所 有 点 都 包含 在 另 一 个 事件 中 ， 那 么 称 第 一 个 事件 包含 于 
(contained in) 第 二 个 事件 ， 或 者 称 第 二 个 事件 包含 第 一 个 事件 .事件 “至 少 一 次 正 
面 ”包含 事件 “两 次 正面 >， 每 个 事件 当然 包含 它 上 自身. 


概率 


样本 空间 中 的 每 一 个 点 对 应 于 它 的 一 个 数 ， 这 个 数 称 为 点 的 概率 (probability of 
the point) 或 结果 的 概率 (probability of the outcome)， 概 率 是 0 至 1 中 的 任意 一 个 实 
数 ， 如 果 我 们 在 相同 的 条 件 下 多 次 重复 该 试验 ， 那 么 这 个 点 或 事件 发 生 的 频数 (fre- 
quency) 就 是 这 个 点 或 事件 发 生 概率 的 一 个 近似 值 . 

定义 1.2.4 如 果 4 表示 一 个 试验 中 的 事件 ，m 是 这 个 试验 独立 重复 了 nn 次 中 
事件 A 发 生 的 次 数 ， 那 么 事件 4 发生 的 概率 ， 记 作 P(4) ， 由 下 式 给 出 

P(A) = lim “4 (1) 

读 作 “ 当 重复 试验 次 数 趋 于 无 穷 时 ， 事 件 4 发 生 的 次 数 与 试验 重复 的 次 数 之 比 的 极限 ”. 

独立 (independent) 的 正式 定义 将 在 后 面 给 出 ， 现 在 我 们 暂且 认为 ， 如 果 某 个 
试验 的 结果 不 影响 其 他 试验 的 结果 ， 则 这 些 试验 是 相互 独立 的 . 

事件 发 生 概 率 的 定义 包含 了 单 点 发 生 概率 的 定义 ， 后 者 可 作为 前 者 的 一 个 特例 ， 
因为 一 个 事件 也 可 以 由 单 点 构成 ， 由 于 事件 发 生 的 次 数 等 于 组 成 该 事件 所 有 互 不 相 
容 结果 发 生 的 次 数 之 和 ， 从 定义 可 知 ， 显 然 一 个 事件 发 生 的 概率 等 于 组 成 该 事件 所 
有 结果 发 生 的 概率 之 和 . 


概率 函数 


在 实际 应 用 中 ， 一 个 特定 样本 空间 的 概率 集合 是 很 少 已 知 的 , 但 根据 试验 者 的 
先 验 知识 ， 这 些 概率 应 是 确定 的 ， 即 试验 者 建立 一 个 模型 来 作为 这 个 试验 的 理想 化 
描述 ， 然 后 察看 这 个 试验 模型 的 样本 空间 ， 并 用 某 种 合理 的 方式 来 给 样本 空间 中 不 
同 点 的 赋 概 . 
例 1.2.3 
在 掷 一 次 均匀 硬币 的 试验 中 ,一般 认为 结果 也 发生 一 半 次 数 的 假设 是 合理 的 ， 这 
样 可 给 结果 H WEB 1/2 ， 对 结果 T 也 一 样 . 我们 记 作 P(H) = 1/2,P(T) = 1/2， W 
例 1.2.4 
在 挪 三 次 均匀 硬币 的 试验 中 ,假设 2” = 8 个 结果 HHH HHT 、HTH \HTT THH THT、 
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TTH TITT 中 的 每 一 个 发 生 具 有 等 可 能 性 是 合理 的 ， 即 每 一 个 结果 发 生 的 概率 是 1⁄8, 

则 可 得 到 P( 三 次 反面 ) =1/8,P( 至 少 一 次 正面 ) =7/8，P( 正 面 多 于 反面 ) = P( 至 少 两 

次 正面 ) =4/8 = 172. S 
前 两 个 例子 中 我 们 已 经 用 到 了 概率 函数 (probability function). 

定义 1.2.5 概率 函数 是 指 对 样本 空间 中 不 同事 件 指定 概率 的 函数 . 

在 例 1. 2. 3 中 ， 概 率 函 数 是 由 P(H) =1/2,P(T) =1/2 给 出 概率 函数 必须 对 
样本 空间 中 的 每 个 点 都 给 出 概率 ， 而 且 样 本 空间 中 事件 的 概率 可 由 它 所 包含 样本 点 
的 概率 来 确定 . 

概率 函数 有 些 人 性 质 很 明显 ， 设 8 为 一 样本 空间 ，4 为 S 中 的 事件 ， 如 果 P 是 一 个 
概率 函数 ， 由 

s 


得 P(S) =1. HX n, 20, HA 


lim 220 
n=œ M 
得 到 P(A) 20. ip A 为 事件 “A 不 发 生 ”， 因 为 ni =n-n,, 并 且 
lim = lim "4 = lim (1— 24) =1— lim =1- P(A) 
n=% H n— °% n— H n= H 


所 以 得 P(A) =1-P(4)， 
条 件 概率 


前 面 提 过 ， 一 个 试验 各 种 不 同 的 结果 是 互 不 相 容 的 ， 然 而 与 一 个 试验 关联 的 不 
同事 件 却 可 能 没有 这 个 性 质 ， 在 掷 三 次 硬币 的 试验 中 ,事件 “三 次 正面 ”与 事件 
“至 少 两 次 正面 ”很 可 能 同时 发 生 . 考虑 在 事件 “至 少 两 次 正面 ”发 生 的 条 件 下 ， 事 
件 “ 三 次 正面 ”发 生 的 概率 ， 如 果 至 少 两 次 正面 朝 上 发 生 了 ， 则 样本 空间 中 的 一 些 
点 ， 比 如 ，TTT,TTH,THT 和 HTT 可 以 排除 ,试验 的 可 能 结果 就 减少 为 4 个 等 可 能 
的 点 ， 所 以 ， 每 一 个 点 的 概率 变 成 /4， 因 此 ， 在 给 定 至 少 有 两 次 正面 朝 上 的 事件 发 
生 时 ,事件 “三 次 正面 ”或 HHH 的 概率 是 1/4. 已 知 的 附加 信息 起 到 了 排除 掉 一 些 
结果 的 作用 ， 也 就 人 为 减 小 了 样本 空间 . 

考虑 另 一 个 掷 仍 子 试验 ， 设 $ 为 样本 空间 , 4 是 “4,5 或 6 发生” 的 事件 ， 8B 是 
“偶数 (2,4 或 6) 发 生 ” 的 事件 ,如 图 1-1 BUR. 在 事件 B 发 生 的 条 件 下 ,事件 4 
发 生 的 概率 记 作 P(A18)， 通 常 读 作 “给 定 事件 B 发 生 条 件 下 事件 4 发 生 的 概率 ”. 
既然 已 知 B 发 生 ， 我 们 不 仅 可 以 去 掉 既 不 在 4 中 又 不 在 B 中 的 点 ， 即 点 1 和 3， 而 且 
还 可 去 掉 不 在 B 中 但 在 4 中 的 点 ， 即 点 5， 这 样 全 部 去 掉 了 不 在 B 中 的 点 ， 此 时 样本 
空间 就 是 B 中 点 的 集合 ，B 中 能 使 事件 4 也 发 生 的 点 是 既 在 4A 中 又 在 B 中 的 点 ， 为 
点 4 和 点 6， 它 表示 “事件 4 Hl B 同时 发 生 ”. 

定义 1.2.6 ”如果 A,B 是 样本 空间 S$ 中 的 两 个 事件 ,事件 "A,B8 同 时 发 生 ” 由 
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图 1-1 样本 空间 S 中 的 事件 A4， 事 件 B 
样本 空间 中 同时 在 4 和 B 中 的 点 组 成 ， 称 事件 4 与 事件 B 的 交 (joint event A and 
B), WHE AB. {FX (joint event) 的 概率 记 作 P(A4B). 
“给 定 8 发生 条 件 下 4 发 生 ” 的 概率 是 “AB” 发 生 的 概率 除 以 样本 空间 “B” 
的 概率 ， 或 用 符号 表示 为 : 


P(AlB) = aD (2) 


从 另 一 方面 来 看 ,假设 前 面 的 试验 进行 了 nn 次, 且 仅 记录 下 了 事件 B 中 的 结果 ， 
而 不 发 生 在 事件 B 中 的 结果 没有 记录 . 设 m 为 事件 B 发 生 的 次 数 ，nss 为 事件 B 发生 
时 A 发 生 的 次 数 ， 那 么 


Ph8 _ ,. nas/n _ P(AB) 
P(A|B) =lim- 7 dm n/n PO) 6) 
如 此 我 们 从 直观 上 证 明了 下 面 的 定义 : 


定义 1.2.7 给 定 事 件 B,A4 发 生 的 条 件 概率 (conditional probability) 就 是 当 给 
定 事件 B 发 生 时 事件 4 发 生 的 概率 ， 由 下 式 给 出 : 


P(A|B) = DN (4) 


其 中 P(B) >0. WÈ P(B) =0, Nj P(AIB) XE X. 
Hj 1.2.5 
BRR PRHRT, 6 种 可 能 结果 中 每 一 种 发 生 的 概率 都 是 1/6. 设 4 是 “4,5 或 
6 发 生 ” 的 事件 ，B 是 “偶数 发 生 ” 的 事件 那么，P(4B) = P(4 或 6) =2/6 =1⁄3, 
并 且 P(B) =3/6 =1/2， 则 条 件 概 率 P(AIB) 由 下 式 算 出 : 


PAMS pn 1⁄2 3 m 


我 们 应 该 注意 这 个 答案 的 合理 性 ， 由 于 知道 偶数 (事件 B) 已 经 发 生 了 ， 则 试 
验 可 能 结果 是 2,4 或 6， 我 们 想 知道 一 个 比 3 大 的 数 CRA) 发 生 的 可 能 性 ， 由 于 
这 三 个 偶数 中 有 两 个 比 3 大 ， 故 答案 是 2/3. 


独立 事件 


条 件 概 率 的 思想 很 自然 地 引出 独立 事件 (independent event) 的 思想 出 现 . 如 果 
在 事件 B 发 生 的 条 件 下 ,A 发 生 的 概率 与 在 不 知道 B 是 否 发 生 的 情况 下 A 发 生 的 概 
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率 相等 ， 我 们 认为 事件 4 的 发 生 与 否 与 事件 B 的 发 生 与 否 独 立 ， 即 如 果 P(A18B) = 
P(A)， 则 4 独立 于 B， 事实 上 ， 这 就 是 事件 独立 性 的 常用 定义 ,但 这 种 定义 从 形式 
上 看 不 出 如 是 否 独立 于 4， 所 以 我 们 在 条 件 概 率 (4) 式 中 用 P(A) 代替 P(A1B)， 得 
到 如 下 和 定义: 
定义 1.2.8 称 两 个 事件 A、B 是 独立 的 (independent) ， 如 果 

P(AB) = P(A)P(B) (5) 
H (5) 式 的 对 称 性 ， 容 易 看 出 ， 如 果 4 独立 于 B， 那 么 B 也 独立 于 和 4， 这 时 我 们 说 
“A 与 B 是 独立 的 "， 即 是 说 它们 相互 独立 . 
例 1.2.6 
在 投掷 两 次 均匀 硬币 的 试验 中 ， 样 本 空间 中 的 4 个 点 的 发 生 是 等 概率 的 ， 设 事件 A 
是 “第 一 次 正面 朝 上 ”， 事 件 B 是 “第 二 次 正面 朝 上 ”， 则 4 中 有 点 HH 和 HT,B 中 
有 点 HH 和 TH， 且 48 中 有 点 HH， 斯 以 P(A) =2⁄4,P(B) =2⁄4, H P(A4B) =1⁄4, 


满足 (5) 式 , 故 A4 和 8B 独立 . = 
下 面 的 例子 说 明 两 个 事件 的 独立 性 并 不 总 是 直观 的 ， 需要 直接 由 定义 和 (5) = 

来 验证 . 

例 1.2.7 


仍然 考虑 投掷 一 个 均匀 骨 子 的 试验 ， 样 本 空间 中 含有 6 个 等 可 能 的 点 1,2,3,4,5 和 
6. 设 4 是 事件 “偶数 发 生 ”， 包 含 点 2,4 和 6; B 是 事件 “至 少 为 4 的 数 " ， 包 含 点 
4,5 和 6; C 是 事件 “至 少 为 5 的 数 ”， 包 含 点 5 和 6. 因为 P(A)P(B) = (1⁄2)(1⁄2) 
=1⁄4, 而 P(AB) =1/3， 所 以 A 和 B 是 不 独立 的 . 然而 A 和 C 是 独立 的 ， 因 为 P(A4) 
P(C) =(1⁄2)(1⁄3) =1⁄/6, 5 P(AC) 相 等 . 图 
独立 事件 和 互 不 相 容 事件 的 概念 有 时 可 能 会 产生 混淆 ， 因 为 两 个 概念 都 给 人 一 
种 “两 个 事件 互 不 干扰 ”的 印象 ， 独立 事件 的 概念 不 仅 依 赖 于 所 考虑 的 两 个 事件 ， 
而 且 还 依赖 于 定义 于 同一 概率 空间 上 的 概率 函数 ， 对 于 某 个 概率 集合 有 可 能 P(4B ) 
与 P(A)P(B) 相 等 ， 而 对 于 另 一 概率 集合 有 可 能 P(A4B) 与 P(A)P(B) 不 相等 但 是 
“ 互 不 相 容 ”是 简单 地 指 两 个 事件 没有 共同 点 ， 而 不 管 定义 在 同一 空间 上 的 概率 孙 数 
如 何 ， 即 AB 是 空 集 ， 所 以 P(AB) =0. 如果 4 和 8B 是 互 不 相 容 的 ， 由 (5) 式 可 知 ， 
只 有 在 P(A) 或 P(B) 为 零 的 情况 下 ， 事件 4,B 才 是 相互 独立 的 . 


独立 试验 


我 们 给 出 独立 试验 (independent experiment) 的 如 下 定义 . 
定义 1. 2.9 ”两 个 试验 称 作 是 独立 的 ， 如 果 一 个 试验 中 的 任 一 事件 4 与 另 一 个 


试验 中 的 任 一 事件 B 都 满足 下 式 : 
P(AB) = P(A)P(B) 


两 个 试验 独立 的 定义 等 价 于 一 个 试验 中 的 每 一 事件 都 独立 于 另 一 个 试验 中 的 每 
一 事件 . 
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验证 对 应 于 两 个 试验 中 的 每 一 对 事件 是 否 满足 定义 1.2.9 是 比较 繁琐 的 ， 然而 ， 
按 定义 来 验证 那些 仅 含 有 一 个 点 的 事件 就 足够 了 ， 对 于 其 他 事件 的 情形 也 自然 得 到 
了 验证 . 

实际 应 用 中 ， 模 型 的 建立 通常 假设 了 独立 性 ， 然 后 再 利用 独立 性 及 定义 1.2.9 中 
的 P(4) 和 P(B) 来 计算 P(4B) ， 这 也 是 独立 性 定义 的 主要 价值 . 因此， 独立 试验 的 
定义 可 合理 地 推广 到 含有 多 于 两 个 试验 的 情形 . 

定义 1.2.10 n 个 试验 相互 独立 (n experiments are mutually independent) ， 如 
果 从 这 个 试验 中 的 每 个 试验 中 任 取 一 个 事件 组 成 n 个 事件 的 集合 ， 都 满足 如 下 等 
式 : 

P(A1A2: ` © An) = P(A1)P(A): : * P (A,) (6) 

其 中 A, 表示 第 i 个 试验 中 的 菜 个 结果 , i=1,2,…,n. 

如 果 不 引 起 混淆 的 话 ， 可 从 前 面 定 义 中 省 略 “ 相 互 ” 这 个 词 . 
Hi 1.2.8 
考虑 投掷 一 次 不 均匀 硬币 的 试验 ， 其 中 事件 互 发 生 的 概率 是 P， 事 件 了 发 生 的 概率 
是 gq=1 -P 独立 重复 三 次 这 个 试验 ， 可 用 下 标 来 记录 相关 试验 的 结果 ， 其 中 
H,T,H, 表示 第 1 次 试验 结果 是 如; 第 2 次 是 T, 第 3 E: H. 由 于 独立 性 假设 ， 有 

P(HT:2H3) = P(H))P(T2)P (H3) = pqp 


3 
如 果 我 们 考虑 这 3 次 试验 中 事件 “ 恰 有 两 次 出 现 正面 ， 则 有 | )] -3 种 方式 ， 因 此 


P( 恰 有 两 次 出 现 正面 ) = 3p°q m 


很 显然 ， 上 面 的 试验 可 以 用 3 个 独立 基本 试验 来 描述 ， 同 时 也 可 推广 到 一 个 含 
有 闫 个 独立 投掷 的 试验 ， 得 到 “ 恰 有 大 次 出 现 正面 ”的 概率 等 于 瑚 9 乘 以 该 项 所 出 
现 的 次 数 ， 因 此 ， 对 于 nn 次 独立 投 毛 一 个 硬币 试验 ， 有 


P( 恰 有 # 次 出 现 正面 ) = (x) pq 0) 


其 中 ， 对 于 每 一 次 投 据 p = P(H). 

前 面 的 3 种 定义 可 以 从 正 反 两 个 方面 加 以 说 明 ， 对 所 有 的 定义 也 是 如 此 例 1.26 给 
出 了 (5) 式 满 足 时 ， 两 个 事件 是 独立 的 ， 例 1. 2. 8 给 出 了 在 有 独立 性 假设 时 ，(6) AW 
足 ， 这 就 是 说 ， 如 果 (6) 式 不 满足 ， 那 么 这 些 试验 就 不 是 独立 的 ; 反之 ， 如 果 这 些 试验 
不 独立 ， 则 至 少 有 一 事件 的 集合 4,4,…A, 不 满足 (6) 式 . 
习题 
l. 在 投掷 3 次 硬币 的 试验 中 ,考虑 投掷 的 次 序 (从 第 1 次 至 第 3 次 )， 列 出 样本 空间 中 

的 点 . 


2. 根据 习题 1， 给 出 
(a) 两 个 互 不 相 容 事件 . 
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(b) 两 个 非 互 不 相 容 的 事件 . 

如 果 降 雨 概率 是 0. 15 ， 那 么 不 降雨 的 概率 是 多 少 ? 

如 果 到 达 一 个 十 字 路 口 时 ， 绿 灯亮 的 概率 是 0.35， 黄 灯亮 的 概率 是 0. 10， 那 么 红 灯 亮 的 
概率 是 多 少 ? 

如 果 一 个 足球 队 赢 球 与 输 球 的 概率 是 相等 的 〈 假 设 没 有 平局 发 生 ， 并 且 每 场 比赛 的 结果 
是 独立 的 )， 那么 在 整个 有 8 场 比赛 的 赛季 中 ， 这 个 球 队 至 少 输 掉 7 场 比赛 的 概率 是 
多 少 ? 

如 果 一 个 球 队 赢得 每 场 比赛 的 概率 是 0.4， 且 与 其 他 场次 比赛 独立 ， 假 设 整个 赛季 有 10 
场 比赛 ， 那 么 这 个 球 队 至 多 赢 一 场 的 概率 是 多 少 ? 

如 果 得 到 一 张 破损 美元 纸币 的 概率 是 0.05， 那 么 在 得 到 的 三 张 纸 币 中 有 两 张 是 破损 的 概 
率 有 多 大 (假设 满足 独立 性 )? 

如 果 被 盗 的 汽车 中 有 60% 能 找 回 ， 且 每 年 有 2% 的 汽车 被 盗 ， 那么 一 个 人 的 汽车 被 盗 且 再 
也 找 不 回来 的 概率 是 多 大 ? 

顾客 购买 某 种 品牌 清洁 器 的 概率 是 0.15， 有 40% 的 顾客 在 购买 清洁 器 时 会 购买 一 个 散 雾 
器 ， 那 么 一 个 顾客 同时 购买 这 两 种 商品 的 概率 是 多 少 ? 


在 投掷 一 枚 均匀 硬币 的 3 次 独立 试验 中 ， 至 少 有 一 次 反面 朝 上 的 概率 是 多 大 ? 
.在 投掷 一 枚 均匀 硬币 的 3 次 独立 试验 中 ， 若 已 知 至 少 有 一 次 已 经 正面 朝 上 ， 那 么 这 时 3 次 


正面 朝 上 的 概率 是 多 大 ? 


在 投 挪 一 枚 均匀 硬币 的 4 次 独立 试验 中 ， 若 已 知 至 少 有 2 次 已 经 正面 朝 上 ， 那 么 这 时 至 少 


3 次 正面 朝 上 的 概率 是 多 大 ? 


在 投掷 一 枚 均匀 硬币 的 3 次 独立 试验 中 ， 如 果 已 知 第 1 次 得 到 的 是 正面 ， 那 么 这 时 3 次 正 


面 朝 上 的 概率 是 多 大 ?( 注 : 习题 11 和 13 的 答案 不 同 , ) 


， 若 每 年 银行 的 学 生 账 号 中 有 75% 被 关闭 ， 且 银行 20% 的 账号 是 学 生 账 号 ， 那 么 银行 的 一 


个 账号 是 学 生 账号 并 且 使 用 期 超过 一 年 的 概率 是 多 大 ? 


， 在 投掷 一 枚 均匀 硬币 的 4 次 独立 试验 中 ， 若 已 知 至 少 1 次 已 经 反面 朝 上 ， 那 么 这 时 得 到 至 


少 3 次 正面 朝 上 的 概率 是 多 大 ? 


， 一 个 摸 彩 游戏 是 从 0 到 9 中 随机 (有 放 回 ) 地 选取 3 个 数字 ，3 次 抽取 相互 独立 ， 例 如 ， 


212 sË 935. 

(a) 在 一 次 尝试 中 ， 成 功 猜 对 3 个 数字 的 概率 是 多 大 ? 3 个 数字 不 考虑 次 序 ， 例 如 ， 即 使 
抽出 数 的 次 序 是 512 或 152， 那么 对 215 的 猜测 也 算 对 . 

(b) 猜 对 555 的 概率 与 猜 对 212 或 935 的 概率 一 样 吗 ? 


思考 题 


l. 
2: 


证 明 : 在 一 个 有 个 点 的 样本 空间 中 ， 至 少 含有 一 个 点 的 事件 的 数目 是 2 - 1. 

本 题 意 在 表明 两 两 独立 并 不 意味 着 三 个 整体 独立 .考虑 从 装 有 数字 1 至 9 的 帽子 中 取 数 ， 
等 可 能 取 到 每 个 数字 的 可 能 性 相等 ， 如 果 取 到 1,2 或 3， 则 事件 4 发 生 ; 取 到 1,4 或 5， 
则 事件 B 发生 ， 取 到 2,4 或 6， 则 事件 CRE. 

(a) 证 明 事件 4 与 独立; 4 与 C 独 立 ; 以 及 B 与 C 独 立 . 

(b) 事件 4,B,C 相互 独立 吗 ? 为 什么 不 是 ? 
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(c) RFE A,B, C 都 不 发 生 的 概率 
1.3 随机 变量 


随机 变量 


一 个 试验 的 结果 可 能 是 数值 的 ， 比 如 考试 的 分 数 ; 也 可 能 是 非 数 值 的 ， 如 从 围栏 
中 逃 出 的 老鼠 对 “红色 的 门 ”的 选择 ， 为 了 分 析 试 验 的 结果 ， 常 用 的 做 法 是 对 样本 空 
间 中 的 点 赋值 ， 任 何 一 个 这 样 赋值 的 准则 称 为 随机 变量 (random variable). 
定义 1.3.1 随机 变量 是 定义 在 样本 空间 上 点 的 实 值 函 数 . 
通常 用 大 写字 母 W,X,Y 或 Z 来 表示 随机 变量 ,也 可 以 带 下 标 .， 随 机 变量 的 值 用 
小 写字 母 表示 . 
例 1.3.1 
在 一 个 试验 中 ， 顾 客 可 以 从 3 种 商品 即 肥皂 、 清 洁 剂 或 商标 A 中 选取 一 种 ， 样 本 空 
间 包 含 代 表 3 种 可 能 选择 的 3 个 点 ， 若 选择 商标 A， 则 随机 变量 X 取 值 1; 若是 其 


他 两 种 结果 则 取 值 为 0， 所 以 P(X=1) 为 顾客 选择 商标 A 的 概率 . m 
在 一 个 样本 空间 定义 多 个 随机 变量 是 比较 方便 的 做 法 ， 如 下 面 例题 所 示 . 
例 1. 3.2 


调查 6 个 女孩 和 8 个 男孩 ， 看 哪 一 个 更 容易 与 自己 的 母亲 还 是 父亲 交流 ， 设 和 表示 
与 母亲 更 容易 交流 的 女孩 数 ，Y 表示 与 母亲 更 容易 交流 的 孩子 总 数 。 如果 X=3， 则 
事件 “3 个 女孩 觉得 与 母亲 交流 更 容易 ”发 生 ， 若 与 此 同时 ，Y=7， 则 事件 “3 个 


女孩 和 7 -3 =4 个 男孩 觉得 与 母亲 交流 更 容易 ”发 生 . m= 
若 X 是 一 个 随机 变量 ,“X = zx” 表示 样本 空间 中 相应 事件 的 简化 符号 ， 它 是 包含 

随机 变量 X 取 值 为 x 的 所 有 点 的 集合 . 

例 1.3.3 

掷 一 枚 硬币 两 次 ， 设 大 为 正面 朝 上 的 次 数 ， 那 么 “和 X=1” 对 应 着 仅 含有 点 HT 和 

TH 的 事件 . a 
因此 “X=x” 通 常 称 作 “事件 X=x”， 意 思 是 “随机 变量 X 取 值 为 x 的 所 有 结 

果 的 事件 ”. 


由 于 随机 变量 与 事件 之 间 的 这 种 紧密 关系 ， 条 件 概率 (conditional probability) 与 
独立 性 (independence) 的 定义 同样 可 用 于 随机 变量 . 
定义 1. 3.2 给 定 Y 时 XX 的 条 件 概 率 是 指 在 随机 变量 Y 取 值 为 y 时 ， 随 机 变量 
X 取 值 为 x 的 概率 ， 记 为 P(X=xlY =y). 
由 定义 1.2.7 可 知 ， 条 件 概 率 的 公式 可 表示 如 下 : 


pa =Y =y) = ae # P(Y =y)>0 (1) 
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例 1. 3. 4 
在 例 1.3.2 中 , 设 X 为 6 个 女孩 中 觉得 与 母亲 交流 更 容易 的 女孩 数 ，Y 为 更 容易 
与 母亲 交流 的 孩子 总 数 . 为 方便 起 见 , 设 Z=Y-X， 它 是 8 个 男孩 中 觉得 更 易 与 
母亲 交流 的 男孩 数目 ， 假 设 每 个 孩子 的 答案 是 相互 独立 的 ， 并 且 每 个 孩子 说 他 
(或 她 ) 更 易 与 其 母亲 交流 的 概率 是 p (未 知 )， 求 条 件 概率 P(X=3|Y=7). 

首先 由 假设 可 知 , X =3 和 2Z=4 是 独立 的 ， 因 为 事件 (X=3,Y=7) 和 事件 
(X=3,Z=4) 是 一 样 的 ， 所 以 联合 概率 为 (由 例 1.2. 8): 

P(X=3,Y=7) = P(X =3,Z = 4) 
=P(X=3)P(Z=4) 由 独立 性 


= 多 p= (5) p‘ -p (2) 
同样 ， 我 们 可 得 到 


pPY= 刀 = (Ja 站 (9) 
所 以 条 件 概率 P(X=31Y =7 ) 为 
6\/8 
Sors usya U. 
ed ln e T n) = .408 (4) 
7 
因为 有 关 未 知 数 p 的 因 式 彼此 抵消 掉 了 . = 


概率 函数 


正如 一 个 样本 空间 中 的 点 是 互 不 相 容 的 ， 随 机 变量 的 取 值 也 是 互 不 相 容 的 ， 即 

对 于 试验 的 一 个 结果 ， 所 定义 的 随机 变量 也 只 有 一 个 取 值 ， 这 样 随机 变量 所 有 取 值 

的 集合 与 样本 空间 有 许多 相同 的 性 质 ， 随 机 变量 各 个 单独 的 取 值 对 应 于 样本 空间 中 

的 各 个 点 ， 一 个 取 值 集合 则 对 应 着 一 个 事件 ， 随 机 变量 在 一 个 数值 集合 内 取 值 的 概 
率 等 于 它 在 这 个 集合 内 取 每 一 个 值 的 概率 之 和 ， 例 如 : 
pla<X<b)= > P(X=x) 


a<x<b 


式 中 求 和 项 包括 所 有 ab 之 间 的 x,， 但 不 包含 a、.b, 且 
P(X= 个 数 ) = X PA=) 


其 中 并 是 对 所 有 取 值 为 偶数 的 x 求 和 ， 由 于 X 的 取 值 集合 与 样本 空间 的 相似 性 ， 描 
述 X 各 种 可 能 取 值 的 概率 称 为 “随机 变量 和 的 概率 函数 ( probability function of the 
random variable X) ”， 正 如 一 个 样本 空间 有 一 个 概率 函数 一 样 ， 但 随机 变量 的 概率 恩 
数 不 是 概率 的 任意 赋值 ， 如 样本 空间 的 概率 函数 ， 因 为 样本 空间 的 每 个 点 一 旦 赋 子 
了 概率 且 在 样本 空间 上 定义 了 随机 变量 ， 那 么 就 知道 了 X 各 种 取 值 的 概率 ， 从 而 式 
的 概率 函数 也 相应 确定 . | 
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定义 1.3.3 对 任 一 实数 x， 随 机 变量 X 的 概率 函数 就 是 X 取 值 为 x 的 概率 ， 常 

用 f(x) 表 示 . 换 句 话说 ， 
f@)= P(X =g) (5) 

在 X 不 能 取 到 的 那些 x AE KROA 0. 

有 时 候 ， 用 条 形 图 来 表达 概率 函数 是 很 方便 的 ， 即 用 随机 变量 的 取 值 作为 横 坐 
标 ( 沿 着 水 平 轴 ) ， 以 概率 为 纵 坐 标 〈 条 形 的 高 度 )， 例 如， 如果 P(X=1) =0.3， 
P(X=2) =0.4,P(X=4) =0.3， 则 这 个 概率 函数 的 条 形 图 如 图 1-2 所 示 ， 条 形 的 高 
度 表示 随机 变量 取 各 种 值 的 概率 


图 1-2 条 形 图 
f(x) 只 是 概率 水 数 的 一 种 表示 方式 ， 其 他 的 表示 有 h(x) ,f(x),f(x) ,g(x)， 
h(x) 等 等 ， 但 不 同 表达 式 的 含义 应 从 上 下 文 了 解 . 


分 布 函数 


我 们 已 经 看 到 ， 随 机 变量 的 概率 分 布 可 以 用 一 个 概率 函数 来 描述 ， 还 有 另 一 种 
描述 方法 ， 就 是 分 布 函数 (distribution function) ， 它 描述 累积 概率 . 
定义 1.3.4 对 任意 的 实数 x， 随 机 变量 X 的 分 布 函数 就 是 三 取 值 不 大 于 x 的 概 
率 ， 通 常 记 作 F(x) ， 换 句 话说 ， 
F(x)= P(X< x) = 之 f(t) (6) 


其 中 求 和 是 对 所 有 不 超过 x 的 上 进行 的 ， 分 布 函 数 也 称 作 累积 分 布 图 数 〈 简 记 c. d. f) 
以 强调 它 表 示 累 积 概率 . 

分 布 函 数 也 可 以 用 图 形 来 表示 ,x 作为 横 坐 标 ，F(x) 作为 纵 坐标 ,沿用 前 面 
的 例子 , 假设 P(X=1) =0.3,P(X=2) =0.4,P(X=4) =0.3， 则 F(x) 的 图 形 如 
图 1-3 所 示 : 

图 中 实际 上 只 含有 水 平 线 ， 画 出 垂直 线 只 是 给 这 幅 图 某 种 直观 上 的 “连接 "， 还 
可 以 帮助 找到 下 一 节 将 要 介绍 的 分 位 数 (quantile)， 垂 直线 的 高 度 与 概率 函数 条 形 图 
中 条 形 的 高 度 相同 . 
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图 1-3 分 布 函数 


二 项 分 布 


对 一 些 众 所 周知 的 分 布 ， 我们 给 出 它们 的 名 字 . 
定义 1.3.5 设 X 是 一 个 随机 变量 ， 二 项 分 布 (binomial distribution) 是 由 如 下 
概率 函数 所 确定 的 概率 分 布 
f(x) = P(X = x) = (") pq x=0,1,...,n (7) 


EF n BERK, 0sps<l,q=1-p. 注意 我 们 使 用 了 约定 0! =1. 
则 它 的 分 布 函数 是 


F(x) = P(X < x) = J, (") pq (8) 
其 中 ， 求 和 是 对 不 大 于 x 所 有 可 能 的 i 进行 的 表 A3( 见 附 表 ) 给 出 了 参数 n 和 p 
的 某 些 特定 值 时 F(x) 的 值 . 
例 1.3.5 


在 含有 次 独立 基本 试验 的 试验 中 ， 每 个 基本 试验 有 两 种 结果 : “成 功 ” 或 “ 失 
败 "， 概 率 分 别 是 p 和 4， 就 像 掷 硬 币 一 样 ， 设 为 在 严 次 独立 基本 试验 中 “成 功 ” 
的 总 次 数 . 正如 1.2 节 中 (7) 式 所 示 


P(X = x) = (") a 
其 中 , x 为 0 # nR HA X RASH A. E 
离散 均匀 分 布 


另 一 个 有 用 的 概率 分 布 就 是 离散 均匀 分 布 (discrete uniform distribution). 
定义 1.3.6 设 X 为 一 个 随机 变量 ， 离 散 均匀 分 布 是 由 如 下 概率 函数 所 确定 的 
概率 分 布 : 


fo) = x=1,2,...,N (9) 
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若 怀 服从 离散 均匀 分 布 ， 则 X 等 概率 取 到 1 至 N 中 的 每 个 整数 值 . 
例 1. 3.6 
H RRA N 个 塑料 筹码 ， 编 号 从 1 到 N， 试 验 是 每 次 从 通 中 取出 一 个 筹码 ， 且 取 到 
每 个 筹码 的 概率 相同 .此 样本 空间 由 NN 个 点 组 成 ,分 别 表示 取出 的 入 个 筹码 ， 设 X 
为 所 取出 筹码 上 的 编号 ， 则 XX 服从 离散 均匀 分 布 . m 


联合 分 布 


当 在 同一 个 样本 空间 上 定义 多 个 随机 变量 ， 或 对 多 个 试验 组 成 的 联合 试验 并 在 
每 一 试验 上 定义 了 一 个 或 多 个 随机 变量 时 ， 需 要 考虑 联合 分 布 ， 通 常用 联合 概率 函 
3 (joint probability function) 或 联合 分 布 函 数 (joint distribution function) 来 刻画 . 
定义 1.3.7 随机 变量 XX,X,,…,X, 的 联合 概率 函数 (joint probability function ) 
f(x, x," x JE X =X ,X=x,，…， 以 及 X,=x, 同时 发 生 的 概率 ， 即 如 下 等 式 : 
Fuipa Xn) = P (X1 = x}, X; = Xz . .. , X, = Xn) (10) 
定义 1.3.8 随机 变量 X,X,,…,X, KRATA hik F(x,,x,, n) Æ X <x,, 
X,<x,,---, AR X, = x, 同时 发 生 的 概率 ， 即 如 下 等 式 : 
F (Xi, xy... Xp) = P (X1 S x, X: << xy, . . . , X, < xi) (11) 
例 1. 3. 7 
考虑 例 1.3. 2 中 定义 的 随机 变量 X 和 Y. 设 f(x,y) 和 F(x,y) 分 别 是 (X,Y) 的 联 
合 概率 函数 和 联合 分 布 函 数 . 由 例 1.3.4 有 


f(3,7 =P(X=3,Y=7)= (5) P pa-p (12) 


F(3,7)= P(X<3,Y<7)= > fixy) (13) 
0<x<3 
x<y<7 


fa y) = (°) px(1 | 8 ) py 261 = j0- 
f x V — x J 


(13) 式 是 对 所 有 满足 : x<3 B y=7, H x,v -x 都 为 非 负 整数 这 样 的 x,y 求 和 的 . 
注意 p 值 未 知 ，(12) 式 与 (13) 式 是 无 法 计算 的 . =s 
定义 1.3.9 E YET, X 的 条 件 概率 函数 (conditional probability function ) 
ARxly)， 是 
fly) = P (X = x|Y = y) (14) 
A G) 式 我 们 可 得 
ivea n PEY =y) 
fly) = P(X = x|Y =y) = PO = 
_ f(x, y) 
f(y) O 
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其 中 , Kx,y) 是 X 和 Y 的 联合 概率 函数 ，fy) 是 Y 本 身 的 概率 函数 

例 1.3.8 

续 例 1.3.7， 设 几 xly) 为 给 定 Y=y 时 X 的 条 件 概率 函数 ， 则 由 (4) RE 
f(3|7) = P (X = 3|Y = 7) = 0.408 

为 找到 一 般 情况 下 ( 即 对 任意 选取 的 x 和 wy) ly RER, ABR Say) KR 

X 和 YY 的 联合 概率 函数 ， 则 由 例 1.3.7 得 


fix, y) = 后 p*(1 一 有 > (, .) py "(1 一 p0» 
它 最 初 是 (2) 的 一 般 形式 . Ay) E Y WJAK3E P 3k. FAB 1. 3.4 我 们 可 得 : 
f= = = (1) a pe 


HE X 1.3. 9 可 得 给 定 Y=y 时 天 的 条 件 概率 函数 : 


da 0<x=<6 
f) Ea 0<y-x<8 
其 中 轻易 地 消去 了 含有 未 知 参 数 p 的 项 . = 


超 几 何 分 布 


前 一 个 例子 中 ， 我 们 已 处 理 过 一 个 称 为 超 几何 分 布 (hypergeometric distribution ) 
的 概率 函数 ， 更 一 般 地 ， 通 常 假设 有 两 类 物体 ， 一 类 有 4 个 物体 和 另 一 类 有 如 个 物 
体 〈 如 前 面 例子 中 女孩 总 数 和 男孩 总 数 ) ， 且 选中 每 个 物体 的 可 能 性 相同 ， 则 在 从 
A +B 个 物体 中 选 出 k 个 的 条 件 下 ， 有 x 个 来 自 4 个 物体 的 概率 ， 这 就 引出 了 超 几 何 
概率 函数 . 

定义 1.3.10 设 X 是 一 个 随机 变量 ， 超 几何 分 布 是 由 下 面 的 概率 范 数 所 确定 的 


概率 分 布 ， 表 示 为 
J (, — J 0<x<A 


Ga 0<k-x<B 
k 

IIF, A,B 和 大 都 是 非 负 整 数 ， 且 k<A-+ PB. 

相互 独立 的 随机 变量 可 按照 独立 试验 中 的 定义 1.2.9 和 1.2.10 的 相同 的 方式 来 
定义 . 

定义 1.3.11 设 随 机 变量 X ,六 ,…,X 分 别 具 有 概率 图 数 户 (六 ),f,(x,), f, 
(x,) ， 且 联合 概率 函数 为 成 局 ,x,，,…,Xx,)， 那 么 六,X,，,"…,X, 是 相互 独立 的 【mutual- 
ly independent) ， 如 果 


f(xly) (16) 


人 (17) 


f(xu xy... Xn) = AADAL) : ` : f(x.) (18) 
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对 于 所 有 x ,x,,…,x, 都 成 立 . 


例 1.3.9 
考虑 例 1.3. 8 中 的 试验 ， 则 X (感觉 更 容易 与 母亲 交流 的 女孩 的 数目 ) 的 概率 函数 
为 : 
Ax) = P(X = x) = (9) 到 人 二 条 一 (19) 
H Y (感觉 更 容易 与 母亲 交流 的 孩子 总 数 ) 的 概率 函数 为 : 
fy) = P(Y = y) = 3 p-p (20) 
由 于 


fG, y) = P(X = x, Y = y) = P(X = x|Y = v)P(Y = y) 
H (16) 和 (20) 式 , 得 X 和 Y 的 联合 概率 函数 为 : 


QC 
f(x, v) = KN (9 pl 一 六 Y= (5) (, ,) py{1 — p); 
y 


但 由 于 
6Y/14) x4 Wes 
fx) (1) = (°)( 4 ) WL 
所 以 我们 有 
fix, v) # f(x) f(y) 
[31] | ik, X 和 YY 不 独立 . B 
习题 
l. 如 果 妃 x) 是 二 项 分 布 概率 函数 ， 其 中 中 =6,P=1/3， K: 
(a) f(6). (b) /(O). (c) /(2.5). 
(d) F(2.5). (e) 天 (一 3). (f) F(7). 
(g) 画 出 概率 函数 的 条 形 图 . (h) HIH hn PR E. 
2. 假设 妃 x) 是 离散 均匀 概率 函数 ， 其 中 N=12， 求 : 
(a) f(2). (b) f(12). (c) f0). (d) /(1.5). 
(e) F(0). (f) F(3.1). (g) F(1000). (h) F( -1000). 
(i) 画 出 概率 函数 的 条 形 图 . (j) 画 出 分 布 函 数 图 . 


3. 假设 XX 和 YY 独立 且 服 从 二 项 分 布 的 随机 变量 ，X 对 应 的 参数 n=3,p =1/2;Y 对 应 的 参 
数 n=4,p=1/2. 设 fx,y) 是 X 和 YY 的 联合 概率 函数 ， 求 : 
(a) f(0,0). (b) f(0,1). (c) /(1,0). (d) f(3,4). 
(e) f(4,4). (f) F(0,0). (g) f(1,1). (h) F(3,4). 

4 ”假设 f(x) 是 超 几 何 分 布 概率 函数 ， 其 中 A =3,B=4, R: 
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(a) 给 定 k=0 时, f(0). (b) 给 定 k=1 BF, f(1). (c) 给 定 k=1 B, f(2). 
(d) 给 定 k=5 时 , f(1). (e) 给 定 k=6 BF, f). 
5. 一 个 用 和 餐 者 从 6 种 不 同 的 三 明治 中 随机 地 选取 一 种 ， 
(a) 样本 空间 是 什么 ? 
(b) 样本 空间 上 的 概率 函数 是 什么 ? 
(c) 在 样本 空间 上 定义 一 个 服从 离散 均匀 分 布 的 随机 变量 . 
6 7 个 男孩 和 10 个 女孩 参加 一 场 考试 ， 假 定 每 一 个 学 生 不 及 格 的 概率 是 0. 2， 
(a) 试验 的 样本 空间 是 什么 ? 
(b) 已 知 有 3 个 学 生 不 及 格 ，3 个 学 生 都 是 男孩 的 概率 是 多 少 ? 
(c) 你 所 采用 概率 分 布 的 名 字 是 什么 ? 


(d) 如 果 每 个 学 生 不 及 格 的 概率 由 0. 2 变 为 0.8，(b) 的 答案 又 是 多 少 ? 
思考 题 
1. 下 面 这 些 函 数 中 的 哪些 可 能 是 概率 函数 ? 并 证 明 你 的 结论 . 
(a) f(x) =1/6 当 x=1,2,3,4， 
=0 否则 
(b) f(x) = (1/4)" 当 x=1,2,3,4,，…， 
=0 I 
(c) f(x) = (1 -p)p' 当 x=0,1,2,…， 
=0 否则 ， 其 中 p 是 (0,1) 上 的 一 个 常数 . 


2. 假设 每 个 患者 都 患 有 同 种 疾病 ， 如 果 不 经 治疗 的 话 ， 病 人 在 一 周 之 内 竣 愈 的 概率 是 0. 1. 
现在 向 10 个 这 种 病人 提供 一 种 新 药 ， 一 周 之 后 10 个 病人 中 有 9 TER T. 
(a) 若 这 种 药物 没有 医疗 作用 ， 至 少 9 人 痊愈 的 概率 是 多 少 ? 
(b) 从 你 的 观点 来 看 ， 你 认为 这 种 药 有 效 吗 ? 
(c) 你 所 使 用 的 样本 空间 是 什么 ? 
(d) 在 样本 空间 上 你 定义 的 概率 函数 是 什么 ? 
(e) 在 样本 空间 上 你 定义 的 随机 变量 是 什么 ? 
(f) 你 所 采用 随机 变量 概率 分 布 的 名 字 是 什么 ? 


1.4 随机 变量 的 性 质 


我 们 已 经 讨论 了 随机 变量 的 一 些 性 质 ， 比 如 概率 函数 和 分 布 函 数 ， 分 布 函数 描 
述 了 随机 变量 所 有 值得 考虑 的 性 质 ， 因 为 分 布 函数 揭示 了 随机 变量 所 有 可 能 的 取 值 
及 其 取 值 的 概率 然而， 有 时 用 整个 分 布 函数 来 描述 随机 变量 是 不 太 方便 或 易 混 消 
的 ， 所 以 需要 随机 变量 的 某 些 “概括 性 描述 ”， 现 在 我 们 介绍 随机 变量 的 另外 一 些 性 
质 ， 它 们 可 以 用 来 对 随机 变量 的 分 布 进行 简洁 而 不 必 完 全 的 描述 . 


分 位 数 
本 书 中 常用 来 概括 随机 变量 分 布 的 方法 就 是 给 出 随机 变量 某 些 特定 的 分 位 数 
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(quantile). “分 位 数 ” 并 不 像 “ 中 位 数 ”、“ 四 分 位 数 ”、“ 十 分 位 数 ” 及 “百分数 ” 
那样 为 众人 所 知 ， 后 面 的 这 些 名 词 是 比较 常用 的 分 位 数 ， 例 如， 随机 变量 的 中 位 数 ， 
是 指 随机 变量 取 值 比 它 大 的 概率 不 超过 1/2， 取 值 比 它 小 的 概率 也 不 超过 1⁄2 的 数 . 
把 这 个 定义 进行 推广 可 得 如 下 : 

EX 1.4.1 对 于 (0,1) 中 的 确定 值 p, 称 x, 为 随机 变量 铸 的 p 分 位 数 
( the pth quantile of the random variable X), WR P(X <x,) <p H P(X >x,) S1 -p. 

如 果 忆 分 位 数 的 定义 不 唯一 ， 为 了 避免 混淆 ， 采 用 惯例 把 所 有 满足 定义 1.4.1 的 
数 x, 中 最 大 数 与 最 小 数 的 平均 值 取 为 其 p 分 位 数 . 

HEXIA, X PEE x, 的 概率 不 大 于 pX K+ x, 的 概率 不 超过 1 - 忆 ， 中 位 数 
(median) 是 0.5 分 位 数 ， 第 三 个 十 分 位 数 (decile) 是 0.3 分 位 数 ， 上 下 四 分 位 点 
( the upper and lower quartiles) 分 别 是 0.75 和 0. 25 分 位 数 ， 第 63 个 百分点 (percen- 
tile) 是 0.63 分 位 数 . 

也 许 寻 找 p 分 位 数 最 简单 直观 的 方法 是 使 用 随机 变量 的 分 布 图 ，p 分 位 数 就 是 在 
图 上 纵 坐 标 是 p 的 点 所 对 应 的 横 坐 标 ， 如 下 例 . 

例 1.4. 1 . 
设 X 是 一 个 随机 变量 ， 有 如 下 概率 分 布 : 

P(X=0)=1/4 P(X=1)=1/4 

P(X =2)=1/3 P(X =3)=1/6 
则 义 的 分 布 函数 可 以 用 图 1-4 来 表示 .0.75 分 位 数 元 7， 即 上 四 分 位 点 ， 可 以 用 画 
一 条 经 过 纵 轴 上 点 0.75 的 水 平 线 来 获得 ， 如 图 1-4 中 的 虚线 所 示 ， 虚 线 与 图 相交 点 
所 对 应 的 x 的 值 就 是 上 四 分 位 数 ， 本 例 中 它 为 2 #K xa =2， 也 可 以 用 定义 来 直接 


验证 ， 因 为 
P(X<2)=1/2 


X075 


图 1-4 z 的 分 布 哨 数 


它 小 于 0.75, H 
P(X>2)=1/6 
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它 小 于 1 - 0. 75， 

中 位 数 可 类 似 地 通过 画 一 条 经 过 纵 轴 上 点 0.5 的 线 获 得 . 这 里 的 中 位 数 可 取 从 
1 到 2 中 的 任意 值 ， 且 容易 看 出 这 些 值 中 的 每 一 个 都 满足 中 位 数 的 定义 ， 通 常 我 们 
取 1.5 作为 中 位 数 . 8: 

某 些 称 之 为 “检验 统计 量 ”的 随机 变量 在 很 多 统计 方法 中 起 着 非常 重要 的 作用 . 
如 果 它 们 的 分 布 函数 完全 未 知 ， 则 这 些 统 计量 就 没有 什么 用 处 ， 附录 中 列 出 了 很 多 
表格 ， 并 给 出 了 非 参数 统计 方法 中 用 到 的 一 些 检验 统计 量 分 布 函 数 的 信息 ， 分 位 数 
的 使 用 浓缩 了 这 些 信息 ， 否 则 这 些 表 将 非常 腾 肿 . 

通常 定义 随机 变量 后 ， 研 究 的 可 能 不 是 随机 变量 本 身 ， 而 是 这 个 随机 变量 的 
函数 .随机 变量 和 的 一 个 实 值 函 数 是 代替 的 取 值 而 给 样本 空间 中 的 点 赋予 新 实 
值 的 准则 ， 例 如 : Y=X+4,Y 是 X 的 一 个 实 值 函 数 . # X =x, M| Y= x+4; # 
X=3,， 则 Y=7， 通 常 记 作 Y=xw(X) ， 此 时 ，x(X) 是 X+4， 其 他 的 x(X) 也 许 是 : 
u(X) =X ,u(X)=X, Rul(X)=(X-a) ,a 为 某 个 常数 ， 尽 管 Y 用 XX 表示 ， 由 于 
Y 也 是 对 样本 空间 中 的 点 赋予 实 值 ， 所 以 我 们 认为 Y 也 是 一 个 随机 变量 .一 般 地 
说 ， 一 个 随机 变量 的 实 值 函数 也 是 一 个 随机 变量 . 


期 望 值 


随机 变量 的 另 一 个 很 有 用 的 量 就 是 它 的 期 望 值 (expected value) ， 首 先 我 们 给 出 
期 望 值 的 一 般 定 义 ， 然 后 再 给 出 一 些 例 子 . 
定义 1.4.2 设 和 是 一 个 具有 概率 函数 妃 x) 的 随机 变量 ， 且 u(X) 是 X 的 一 个 实 
值 函 数 ， 则 x(X) 的 期 望 值 ( 记 作 E[u(X)]) 定义 为 : 
E[u(X)] = > u(x)f (x) (1) 


x 


其 中 ， 求 和 是 对 刁 的 所 有 可 能 值 进行 的 ， 如 果 (1) 式 右 端的 求 和 是 无 穷 大 ， 或 不 存 
在 ， 我 们 就 说 &(X) 的 期 望 不 存在 . 
实际 中 ， 我 们 主要 关心 的 是 两 个 期 望 值 ， 即 X 的 均值 和 方差 . 
定义 1.4.3 设 X 是 一 个 具有 概率 函数 f(x) 的 随机 变量 ,，X 的 均值 (通常 记 
Enu) 是 
u= E(X) (2) 
H (1) 式 , 我 们 有 : 
u= E(X) = > xf(x) (3) 


(3) 式 表明 均值 与 物理 学 中 的 “重心 ”是 一 样 的 ， 都 是 一 个 中 心 点 ,平衡 点 ， 如 果 在 
某 标尺 上 的 每 一 个 X 取 值 处 放置 相应 的 正比 于 概率 的 重量 ， 则 这 个 标尺 将 恰好 在 均值 
处 达到 两 边 平衡 ， 正 因为 均值 的 这 种 可 “查找 ”分 布 中 心 的 位 置 的 性 质 ， 均 值 也 称 作 
“位 置 度量 "， 前 面 讨 论 过 的 均值 和 中 位 数 是 两 种 最 常用 的 位 置 度量 . 
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例 1.4.2 

考虑 具有 “成 功 ” 和 “失败 ”两 个 结果 的 简单 试验 , “成 功 ” 的 概率 是 p,“ 失 败 ” 

的 概率 是 4 (等 于 1 -PP)， 如果 “成 功 ” 发 生 ， 则 令 X=1; 若 “ 失 败 ” 发 生 ， 则 令 

X=0. 这样 X 是 n=1 的 二 项 分 布 , 由 (3) R, 的 期 望 值 为 : 

E(X)= 1(p}+ 0(1 —p) = p (4) 

亦 即 , X 的 均值 是 p。 如 果 发 生 的 结果 为 等 概率 的 ， 即 p =1/2, UM X KAE 1⁄2. W 

例 1.4.3 

考虑 一 个 总 在 同一 餐馆 吃 午餐 的 商人 ， 和 餐馆 的 午餐 有 4 种 定价 : 4. 00 美元 、4. 50 美元 、 

5.00 美元 和 5. 50 美元 ， 赁 以往 的 经 验 ， 他 知道 自己 每 一 天 选择 4.00 美元 午餐 的 概率 是 
[36] |0.25, 选择 4.50 美元 午餐 的 概率 是 0.35， 选 择 余 下 两 种 价格 午餐 的 概率 都 是 0.20， 设 


为 每 天 的 午餐 价格 ， 以 美元 为 单位 ， 则 X 的 概率 函数 是 
P(X=4)=0.25 P(X = 4.5) = 0.35 
P(X =5)=0.20 P(X = 5.5) = 0.20 


H (3) A, 得 到 X 的 均值 为 : 
E (X) = (4)(0.25) + (4.5)(0.35) + (5)(0.20) + (5.5)(0.20) = 4.675 


经 过 一 段 较 长 的 时 间 后 ， 商 人 发 现 ， 尽 管 他 的 每 一 次 午餐 花费 不 尽 相 同 ， 但 他 的 午餐 平 
均 支 出 却 大 约 是 4.675 美元 . i: 


刻度 


正如 称 均值 和 中 位 数 为 位 置 度量 -一样 ， 度 量 随机 变量 的 伸展 或 变异 的 量 称 为 “刻度 
度量 "， 一 个 基于 分 位 数 的 刻度 度量 是 四 分 位 极 差 〈interquartile range), CEH zx 减 去 
加 xs 得 到 的 ， 另 一 个 直接 基于 概率 函数 的 刻度 度量 是 极 差 ， 它 等 于 随机 变量 的 最 大 可 能 值 
减 去 最 小 可 能 值 ， 最 常用 的 刻度 度量 是 标准 差 (standard deviation) ， 它 等 于 如 下 所 定义 的 


方差 的 平方 根 . 
定义 1.4.4 设 X 是 一 个 有 均值 i. 和 概率 函数 f(x) 的 随机 变量 , X 的 方差 ( 记 作 o° 


或 Var(X) ) 定义 为 : 
o? = E[(X — u) (5) 
H (1) 式 , X 的 方差 可 以 写作 : 
o? = >; (x — uyf(a) = E (è — 2ux + n2)f(x) 
= > xf (x) — 2p 2, xf(x) + 2 2, f(x) (6) 
因为 f(x) =1， 且 由 (3) Ñ, MJ (6) REX: 
o’ = E(X2) — 22 + p? = E(X’) — p? (7) 


这 是 计算 方差 更 常用 的 形式 
方差 的 正平 方 根 称 为 X 的 标准 差 (standard deviation)， 记 作 o. 
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例 1.4.4 
# X IRA n=1 的 二 项 分 布 , H P(X=1)=p,P(X=0)=1-p. 在 例 1.4.2 中 求 得 X 的 均 
值 为 P， 因 此 由 (6) 式 得 

o? = (1 — p)°(p) + (0 — p( — p) = p( — p) = pq (8) 
另外 ,我 们 还 可 用 (7) 式 来 计算 r. A (1) 式 计算 E(X ) 

E(X’) = (1°(p) + (0)*(1 — p) = p 


则 夸 的 方差 为 

o° =E(X°)- p’ =p- p = p( — p) 
与 (8) 式 一 致 . X 的 标准 差 是 /p(1 - p). m 
j 1. 4. 5 


有 编号 从 1 至 6 的 6 个 相同 筹码 ， 一 只 猴子 从 中 拿 了 一 个 ， 交 给 它 的 训练 者 ， 样 本 空间 
是 猴子 取 到 的 筹码 ， 设 六 表示 筹码 上 的 数 ， 若 每 一 个 筹码 等 可 能 被 选中 ， 其 概率 是 1⁄6, 
那么 羡 服 从 离散 均匀 分 布 ， 则 X 的 均值 如 下 : 
E(X) = 1(à) +28) + 3(à) + 4(à) + 56) + 60) = 3 
X 的 期 望 值 如 下 : 
E (X°) = 1(Ë) + 48) + I4) + 16(ü) + 256) + 366G(ü) = 15} 
H (7) R, X 的 方差 为 : 
Var (X) = E(X2) — 2 = 154 — (32 = 2B 
标准 差 是 方差 的 平方 根 ， 此 例 中 它 为 1.71. is 
定义 1.4.2 中 定义 了 单个 随机 变量 的 函数 的 期 望 值 ， 这 里 可 以 推广 到 多 个 随机 变量 的 
联合 函数 的 情况 ， 它 可 以 用 来 考虑 两 个 随机 变量 的 协 方 差 (covariance) ， 也 能 求 几 个 随机 
变量 和 的 均值 和 方差 . 
定义 14.5 REIER X, X, o, X. KAMERKA f (x. x, X), 
u(X ,XXX) 是 和 ,大 的 实 值 函数 ， 则 u(X XX) AMRA (expected val- 
ue) 定义 为 : 
Elu(Xi, Xy, ... , Xn)] = Siy ea) o Xn) (9) 
Ep, 求 和 是 对 所 有 可 能 取 到 的 x x... ITH. 
X,,X,,::: X, 的 一 个 简单 函数 是 
Y = XI + X; + : : + X, (10) 
即 随机 变量 Y 的 每 一 个 值 都 与 包含 X 试验 的 联合 试验 有 关 ， 它 是 所 有 X, 的 取 值 之 和 . 
E(Y)= YG t+ xn)f (x . . Xn) 


= OXf Xp WT Xn) (11) 
其 中 ， 求 和 是 对 x, ,…,x, 所 有 可 能 的 联合 取 值 求 和 .由 定义 1.4.5 和 (11) 式 立 即 得 到 
E(Y) = E(X?) +: -< + E (X,) (12) 


这 些 计 算 结 果 可 以 陈述 为 如 下 定理 : 
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定理 1.4.1 设 X,X%,…,X, 是 随机 变量 , 且 
Y = X, + X; t : : : + X, 
WA ECY) =E(X,) +E(X,) ++ + E(X,). 
定理 1.4. 1 中 的 结论 在 任何 情形 下 都 成 立 ， 不 论 随机 变量 独立 与 否 ， 对 看 上 去 很 难 求 
的 一 些 随机 变量 和 的 均值 问题 ， 使 用 定理 1.4.1 后 ， 常 常 使 问题 变 得 简单 . 
[2] 下 面 两 个 例题 的 结论 将 在 后 面 的 章节 中 用 到 
例 1.4.6 
设 Y 是 n 次 独立 基本 试验 中 “成 功 ” 的 总 次 数 ， 每 一 个 基本 试验 中 ,“ 成 功 ” 或 者 “ 失 
败 ” 的 概率 分 别 为 p 或 9g=1-p， 则 Y 服 从 参数 为 n,p 的 二 项 分 布 ， 实 际 上 ，Y 也 可 看 
HE n 个 独立 的 随机 变量 XX ,XX ,…,X, ZA Hp, X, =1， 若 第 i 个 基本 试验 的 结果 是 
“成 功 ”; X =0， 若 第 i 个 基本 试验 的 结果 是 “失败 ”(i X 1 #jJ n). MH 
Y = X, + X; + +: ° - + X, 
且 由 定理 1.4.1 
E(Y)= E(X)) + E(X;) + : : :+ E(X,) 
在 例 1.4.2 中 , X, 的 均值 是 p， 因 此 


E(Y) = np (13) 
即 是 二 项 分 布 的 均值 = 
注意 在 二 项 分 布 中 的 基本 试验 认为 是 相互 独立 的 ， 因 此 X, 是 独立 的 .这 个 假设 在 求 
均值 时 不 需要 用 到 
在 例 1.4.7 中 ， 需 要 用 到 以 下 引 理 ， 它 给 出 了 连续 整数 和 的 简洁 表达 式 . 
引 理 1. 4.1 


N (N+a(N-a+1 Z Š . _ (N+ DN 
> r a 


N 

S=a+(a+1)+(a+2)+--:+({(N-1)+N 
S=N+(N—1)+(N-2)+.---+(a+1)+a 

将 上 述 两 个 等 式 相 加 ， 得 到 

2S=(N+a)}+(N+a)+(N+a)+:--+(N+a)+(N +a) 
=(N +a)XN -—a + 1) 
因此 
s= = NtAN-a+1) 


2 


= 
lI 
> 


当 a =1 时 ， 得 到 
Y = (N+ DN 


oeg 


= 


_ 


证 毕 . 
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例 1.4.7 
HPA N 个 筹码 ， 编 号 从 1 到 N， 从 中 依次 取出 n 个 ， 其 中 小 于 和 N， 记 下 对 应 的 编号 ， 
置 于 一 旁 . 设立 是 取出 的 个 筹码 上 的 编号 之 和 ， 假 设 抽 取 是 随机 的 ， 即 每 个 筹码 等 可 
能 取 到 |. 

Y 的 均值 如 果 不 用 定理 1.4. 1 是 不 易 求 的 、 由 于 一 旦 记录 了 一 个 筹码 的 编号 ， 则 其 
他 的 筹码 就 不 会 出 现 这 个 编号 ， 故 此 连续 抽取 不 是 独立 的 . 然而 ,我 们 仍 把 Y 作为 随机 
变量 X, ,X, Ca 之 和 ， 其 中 X, 表示 第 i 次 取出 筹码 的 编号 ， CAREA 


PX = 及 = 六, 其 中 K= 123...N 
因此 ， 借助 引 理 1. 4. 1， 我 们 有 


el th 14 
E(X) = 之 k 外 (14) 
(14) 式 给 我 们 提供 了 一 -个 离散 均匀 分 布 的 均值 ， 因 为 Y=X, +X, +… +X,， 所 以 我 们 有 
E(Y) = E(Xi) + E(X) + ` ` + EC =n (15) 

m 


协 方差 


两 个 随机 变量 一 个 特别 有 用 的 隧 数 是 
[XI — E(X;)][X; — E(X2)] 
它 的 期 望 值 称 为 X 5 X, 的 协 方差 《covariance )， 特 别 地 ， 比 较 定 义 1.4.4 与 下 面 的 定义 
可 以 发 现 ，X 的 方差 就 是 它 自 身 的 协 方差 . 
定义 1.4.6 设 随机 变量 X AX, 分 别 具 有 均值 jw, Mu, WRR f, (x,) MAO), 
其 联合 概率 函数 为 f(x >x, ). X, 和 X, 的 协 方差 定义 为 : 
Cov (X, X2) = E [(Xi — AI)(X2 一 A2)] (16) 
由 关于 期 望 值 的 定义 1.4.5， 可 得 : 
Cov (Xi X;) = E[(X; — AI)(X2 — p20)] = 六 (xl — m(x — u) f lxi x2) (17) 
求 和 是 对 所 有 x ,x, 的 可 能 取 值 进行 的 ， 展 开 得 
Cov (Xy, X;) = X (xix> — pix2 — pa + Ban) f (xy, X2) 
= E(X1X2) 一 pim 一 papi + pim 
= E(X1X2) 一 pm (18) 
在 计算 协 方差 时 ，(18) 式 通常 比 (17) 式 更 好 用 . 
例 1.4.8 
保险 公司 发 现 每 个 人 在 一 年 内 发 生 一 次 交通 事故 的 概率 是 0 1， 但 如 果 知 道 他 上 一 年 发 生 
过 交通 事故 ， 那 么 这 个 概率 变 成 了 0.3. 
iX 取 值 0 或 1， 分别 对 应 于 某 人 在 他 保险 期 间 的 第 一 年 内 没有 发 生 事故 以 及 至 少 
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发 生 过 一 次 事故 ; X, 类 似 于 X, 的 定义 ， 对 应 于 他 保险 期 间 的 第 二 年 的 情况 ， 则 X, 的 概 
率 函 数 是 
P(XI=0)=09 PXI=J)=0.1 
X, 也 有 相同 的 概率 函数 ， 从 例 1. 4 2， 我 们 得 到 
E(Xi)=0.1 E(X) = 0.1 
X, AX, 联合 概率 函数 在 X=1 fl X, =1 时 的 值 ， 可 由 下 式 表示 ; 
f0,1) = P(X = 1, X, = 1) = P(X% = 1|X; = DP(Xi =) 
= (0.3)(0.1) = 0.03 
由 定义 1.4.5 可 直接 得 E(XX ) 的 表达 式 如 下 : 
E(X,X;) = (1)(1)/(1,1)+ “0” i= 0.03 
再 用 (18) R, TX, fl X, 的 协 方差 为 : 
Cov (Xi, X2) = E(X,X;) — E(Xi)E(X) = 0.03 — (0.1)(0.1) = 0.02 


相关 系数 


现在 我 们 来 定义 相关 系数 《correlation coefficient) ， 它 是 两 个 随机 变量 间 线 性 相关 性 
的 一 种 度量 ， 这 里 我 们 不 加 证 明 地 陈述 两 个 结论 : 相关 系数 总 是 在 -1 和 +1 之 间 ; 当 两 个 
随机 变量 相互 独立 时 ， 它 一 定 等 于 0 (在 其 他 情形 也 可 能 是 0). 

定义 1.4.7 两 个 随机 变量 的 相关 系数 (correlation coefficient) 是 它们 的 协 方差 除 以 
它们 标准 差 的 乘积 ， 相 关系 数 常用 p 表示 ， 由 下 式 给 出 

= Cov (X, X2) 
P War (X0Var (X?) 

下 面 给 出 在 例 1.4.9 中 要 用 到 的 一 个 引 理 ， 这 个 引 理 提供 了 前 N 个 连续 整数 的 平方 和 
的 简洁 表达 式 . 

引 理 1. 4. 2 


(19) 


N a _N(N+1)(2N +1) 
ais 6 


N 
证 明 s= > P, 则 
S= +2 +32 +4 +. + N 
=1 +2 +3 +4 +--- +N 
+2 +3 +4 +--- +N 
+3 +4 +: +N 
+4 十.… 二 人 


+N 
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其 中 在 第 i 列 数 的 和 是 站， 可 我 们 并 不 对 列 求 和 而 是 对 行 求 和 . 从 第 j 行 顶端 开始 ， 
对 第 j 行 的 所 有 数 求 和 ， 由 引 理 1.4.1 得 
jt j j+1)+(]j+2)+-- +N= 
再 把 这 些 行 加 起 来 ， 得 
s LINAN- 


NIIN TIID SAN +N+j- j) 


| Nt ja 
j= 


j=! 


iE + 1)N 
2 


=KN:N)+MN-N)+1- 一 好 


这 里 第 2 个 等 式 中 的 最 后 一 个 求 和 项 可 由 S 表示 ， 因 而 ， 移 项 得 到 : 
šS = 1(2N3 + 3N? + N) = !N(N + 1)(2N + 1) 


所 以 
-Öz M NN + DQN + 1) 
s= BrE 6 
证 毕 . 
例 1.4.9 


如 例 1.4.7， 一 个 钠 中 有 编号 从 1 到 NN 的 NN 个 塑料 筹码 ， 试 验 是 从 名 中 取出 个， 其 中 
nN， 假 设 每 个 筹码 都 是 等 可 能 取出 的 且 不 放 回 ， 设 XX ,X,,…,X, 为 随机 变量 ， 其 中 X. 
表示 第 i 次 取出 的 筹码 的 编号 ，i =1,2,…,n， 在 本 例 中 ,我 们 要 求 X, MX, 的 协 方差 ， 由 
例 1.4.7， 我 们 得 到 X, 的 均值 


E(X) = `; : 
HH (7) 式 和 引 理 1.4.2， 我 们 得 X, 的 方差 
Var (X) = E (X) — [E(X)Y = È ei - (= n) 
_ L wv pews (NH _ (N + XXN - 1) (20) 
N 6 r E 12 
下 面 我 们 求 随 机 变量 天 MX, 的 协 方差 ， 其 中 ; 关 六 它们 的 联合 概率 级 数 为 
fi xi) = P (X, = xi, X; = x;) = P(X; = xi|X; = x) : P (X; = x;) 
= 一 .二 kh xi,xi=1,2,...,N; xi xj (21) 


N-—-1 N 
由 定义 1.4.6, X, MX, 的 协 方差 可 如 下 表示 ; 
Cov (X;, Xi) = E([X; — E (X;)][X; — E(X;))) 
_ N+1 ( _N+I 1 
à 24- 2 J 2 E 
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其 中 ,， 求 和 是 对 所 有 的 k,s 从 1 #J N, H k=s 进行 的 (X, 与 X, 不 能 同时 取 相 同 的 值 ). 
如 果 同 时 加 上 和 减 去 上 =s 的 项 ， 则 方差 为 


on 1 ANA N+1)YS / _N+1 1 K&/. N+1Y1 
Cov (Xi X) -mn > (k nH) 3 (s > ) -人 7] E (22) 


为 简化 (22) 式 ， 我 们 注意 到 


N 
> (1-74) =0 (23) 


由 方差 的 定义 及 (20) 式 ， 我 们 得 


N N+1) 3 (N + 1)(N-1) 
Var (X) = © { k - =} 二 = 一 一 全 一 一 24 
ar (Xi) > ( N 1. (24) 
把 (23) RA (24) RRA (22) 式 ， 得 到 : 
Cov (X; x) = -~ = (25) 
E 


[45] 协 方差 的 重要 性 质 就 是 讨论 在 两 个 独立 随机 变量 的 情形 下 协 方 差 的 取 值 . z X, A X, 
是 两 个 独立 的 随机 变量 ， 分 别 有 概 率 函 数 户 (z ) 1 f,(x,), EJ u, Ma, WX, AX, 的 协 
方差 为 


Cov (Xy X) = 之 xix2fi(x1) f(x) — mm = È nfi | È xf) — mm 
Eai *i x” 


= mpm 一 AI = Ü 
这 说 明 ， 两 个 随机 变量 的 独立 性 意味 着 它们 的 协 方差 是 0， 即 它们 的 相关 系数 也 是 0. 
定理 1.4.2 如 果 X fl X, 是 两 个 独立 的 随机 变量 ， 则 X 5 X, 的 协 方差 是 0. 
下 面 例 1. 4. 10 表明 ， 定 理 1.4.2 的 逆 命 题 不 一 定 正确 . 即 ， 协 方差 是 0 并 不 意 
味 着 随机 变量 是 独立 的 ， 而 在 实际 中 却 经 常 出 现 这 样 的 误解 . 
例 1.4.10 
定义 两 个 随机 变量 的 联合 概率 卫 数 如 下 
P(X=0,Y=0)=1/2 
P(X=1,Y=1)=1/4 
P(X = -1,Y=1)=1/4 


则 X 的 概率 函数 为 
P(X=0)=1/2 
P(X=1)=1/4 
P(X = -1) =1⁄4 
Y 的 概率 函数 为 
P(Y=0)=1/2 P(Y=1)=1/2 
X 和 YY 的 期 望 值 为 


E(X)=0 E(Y)=1/2 
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XA Y 的 协 方差 为 
Cov (X, Y) = E(XY) — E(X)E(Y) = (1) @) + (—1)@) — (0)()=0 


然而 , 和 和 Y 却 不 独立 ， 因 为 
P(X=0Y=0)=1/2 


它 不 等 于 
P(X = 0)P(Y = 0) = H$) = 1/4 


因此 X 和 Y 有 0 协 方差 ， 但 它们 却 不 独立 . 图 
下 面 我 们 准备 求 一 些 随机 变量 和 的 方 益 . 设 Y=X,+X,+…+X,， 其 中 ，X; Z š] 
可 能 独立 也 可 能 不 独立 要求 Y 的 方差 ， 由 方差 的 定义 有 : 
Var (Y) = E{[Y — E(Y)Ë) = E([X, + X, + + -© + X, — E(X,) — E(X;) — : : © — E(X,)]2) 
N N N 
=E > [X; — E(X) + > > [Xi — E (X)][X; 一 Exp} 
i= i= j= 
i*j 
但 是 ， 由 于 随机 变量 和 的 期 望 值 等 于 这 些 随 机 变量 期 望 值 的 和 ， 所 以 
Var (Y) = > E([X, — E(X;)]} + > > E{[X; — E(Xi)][X; — E(Xp]) 


= > Var (X;) + + 之 Sco (X; X;i) (26) 
ii 
如 果 X, w” e a 相互 独立 ， 由 定理 1.4. B; 我 们 有 Cov( ,和 ) =0, 且 
Var (Y) = š Var (X;) (27) 
i=1 
我 们 把 上 述 内 容 总 结 成 如 下 定理 : 


定理 1.4.3 X,X,X, 是 随机 变量 且 
Y= 
则 
Var (Y) = 5 Var (X;) + > > Cov (X;, X;) 
i=1 ji 


i=] 
1) 


进一步 讲 ， 如 果 X,X,X 相互 独立 ， 则 
Var (Y) = > Var (X;) 
例 1.4.11 | 
续 例 1.4.9. É X, 是 取出 的 第 i 个 筹码 的 编号 ， 且 Y 是 所 有 XX 的 和 ( 见 例 1.4.7)， 
则 由 定理 1. 4. 3 得 到 
Var (r) = Z Var X) + 2 È Cov (Xi, Y;) 
isj 


等 式 中 的 诸 项 由 (20) RA (25) 式 给 出 ， 其 中 方差 项 出 现 了 nn 次 ， 协 方差 项 出 现 
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『n(n-1) 次 ， 亦 即 
= WEIN- _ 5 _ n(N + 1)(N — n) 
Var(Y)=n 12 + n(n — 1) ETE ) “N+ Nm 


12 (28) 
注意 ，Var(X,) 是 n=1 时 Var(Y) 的 特殊 情形 . m 
二 项 分 布 的 协 方差 在 下 面 的 例 1.4. 12 中 给 出 . 
例 1. 4. 12 


考虑 nn 次 独立 的 基本 试验 ， 每 个 基本 试验 结果 是 “成 功 ” 或 “失败 "，, 且 “ 成 功 ” 
和 “失败 ”的 概率 分 别 是 p 和 94， 其 中 p+g=1 与 例 1.4.4 和 例 1.4.6 类 似 , D X, 
WORI, 分别 对 应 于 第 i 个 基本 试验 是 “失败 ”或 “成 功 ”, 设 Y 为 n 次 试验 中 总 
的 “成 功 ” 次 数 . 由 X, 相互 独立 及 定理 1.4.3， 有 


Var (Y) = pY Var (Xi) 
i=1 


由 例 1.4.4 8, Var(X,) =pq， 所 以 
Var (Y) = npq 
这 就 得 到 了 二 项 分 布 Y 的 方差 . Bs 
前 面 例题 的 一 些 结果 在 这 本 书 的 后 面 要 用 到 ， 为 方便 起 见 ， 把 它们 陈述 为 相应 
的 定理 . 
定理 1.4.4 设 X 是 服从 二 项 分 布 的 随机 变量 


P(X Z k) ais c) jpg 
W X 的 均值 和 方差 由 下 式 给 出 
E(X)= np Var(X) = npq 
定理 1.4.5 设 X 是 从 1 至 NN 这 NN 个 整数 中 ,无 放 回 地 随机 取出 的 个 整数 的 
和 ， 则 和 的 均值 和 方差 是 


E(X)= 


"LU Var (X) = 


n(N + 1)(N — n) 
12 
例 1. 4. 13 
广告 代理 商 为 他 们 的 一 位 客户 挑选 了 12 个 样品 杂志 广告 ， 并 把 这 些 广告 按照 他 们 
认为 的 对 出 售 商品 的 影响 力 大 小 进行 排序 ， 最 有 效 的 广告 排序 为 1， 等 等 ， 这 名 客 
户 (产品 的 生产 者 ) 选择 购买 了 4 种 广告 ， 代 理 商 对 它们 的 排序 是 4,6,7 和 11. 
假设 客户 的 选择 和 代理 商 的 排序 是 独立 的 ， 则 被 选 广告 排序 和 的 分 布 等 同 于 与 
从 标号 1 到 12 的 12 个 筹码 中 取出 4 个 筹码 标号 和 的 分 布 ， 设 X 为 被 选 的 4 个 广告 的 
排序 和 ， 由 于 被 选 的 广告 独立 于 排序 ， 由 定理 1.4.5 可 得 X 的 均值 为 


ex) = tD = 26 
且 X 的 方差 为 
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Wi (4)(12 202 =D 344 
X 的 标准 差 为 
g= V Var (X) = 5.9 
X 的 观测 值 为 
X=4+6+7+11=28 

在 前 面 的 假设 下 ， 这 个 值 与 X 的 均值 比较 接近 . mi 
习题 
l. # P(X=0)=1⁄3,P(X=1) =1/3,P(X=2) =1⁄6, B P(X=3) =1⁄6, k 

(a) E(X). (b) Var(X). (c) E(X +2X). 

(d) 中 位 数 . (e) xis- (f) 第 4 个 十 分 位 数 . 
2. 若 P(X=0) =0,P(X=1) =1/2,P(X=2) =1/4,P(X=4)=1/4, 求 

{a) E(X). (b) Var( X). (c) E( - X). 

(d) 中 位 数 . (e) 上 四 分 位 数 . (f) 第 37 百 分 位 数 . 
3. 车 P(X=0,Y=0)=1/4,P(X=0,Y=1) =1/4,P(X=1,Y =0) =1⁄4, H P(X=1,Y=1) =1/4, K 

(a) E(X). (b) E(Y). (c) E(XY). 

(d) E(X+ Y). (e) Cov( X, Y). (f) P(X=0). 

(g) P(X=1). (h) X 5 Y hyg? 
4. 车 P(X=0,Y=0) =1/8,P(X=0,Y=1) =3/8,P(X=1,Y=0) =3⁄8, H P(X=1,Y=1) 

=1/8, K 

(a) E(X). (b) E(Y). (c) E(XY). 

(d) E(X Y). (e) Cov(X,Y). (f) P(X=x) 对 每 一 工 


(g) X $ Y 3k? 
5. 1266, 这 66 个 整数 的 和 是 多 少 ? 
6. 从 70 #J99, 这 30 个 整数 的 和 是 多 少 ? 
7. 车 导 为 投掷 一 次 均匀 般 子 得 到 的 点 数 ， 求 


(a) E(X). (b) Var(X). (c) E(X +X). 
8. 若 从 1 到 30 连续 地 对 30 张 票 编 号 ， 从 中 无 放 回 地 随机 取出 2 张 票 ， 求 
(a) E (这 两 张 票 的 编号 和 ). (b) Var (这 两 张 票 的 编号 和 ). 


9. 若 10 个 顾客 从 1 到 10 连续 地 编号 ， 随 机 地 选 出 2 个 进行 访问 ， 求 这 两 位 顾客 编号 和 的 均 
值 、 方 差 和 极 差 . 
10， 若 100 个 顾客 从 1 到 100 连续 地 编号 ， 随 机 地 选 出 12 个 进行 访问 . 求 选 中 顾客 编号 和 的 


均值 、 方 差 和 极 差 . 

Il. 若 P(X=0,Y=0) =1/3,P(X=0,Y=1) =1/3, H P(X=1,Y=0) =1⁄3. 
(a) 求 X 的 边缘 概率 分 布 . (b) 求 E(XY). 
(c) 3R Cov(X,Y). (d) R X,Y 的 相关 系数 . 


12， 一 维 随机 变量 (X,Y) 取 值 (1.1) 的 概率 是 0.25， 取 值 (2,1) 的 概率 是 0.25， 取 值 
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(1,2) 的 概率 是 0.50. 求 X 的 中 位 数 ，Y 的 方差 和 XY 的 协 方差 .、 假设 F(x,y) 是 (X， 
Y) 的 分 布 函 数 , 求 FL1,2) 并 画 出 X 的 分 布 函数 及 Y 的 概率 函数 图 . | 
13. #8 匹 马 参加 赛马 大 赛 ， 其 中 有 3 匹 马 来 自 Lubbock， 它 们 的 位 置 (1 至 8) 是 无 放 回 地 
随机 指定 的 . 设 X 表 示 来 自 Lubbock 的 那 3 匹 马 的 位 置 编号 和 ， 求 X 的 均值 和 方差 . 
14， 设 XX 与 Y 是 两 个 独立 的 二 项 分 布 随 机 变量 ,对 于 ,n=3,p =1/3; 对 于 站 ,n=4,p =1⁄4. 
求 F(1,1) 以 及 E(XY). 


思考 题 


1. 在 随机 变量 X 的 均值 处 画 一 条 竖 直 线 ， 它 把 X 的 分 布 函数 进行 了 划分 证明: 在 分 布 函 
数 下 方 、0 上 方 并 在 均值 左边 的 区 域 的 面积 等 于 在 分 布 隔 数 上 方 、1 下 方 并 在 均值 右边 的 
区 域 的 面积 (提示: 画 一 个 分 布 函数 图 ， 考 虑 要 研究 的 面积 ). 


2. 用 由 引 理 1. 4. 1 获得 引 理 1. 4. 2 的 类 似 方式 ， 用 引 理 1. 4.2 来 证 明 如 下 的 引 理 1. 4. 3 


>: ia uks + 1) 
[更 一 般 的 推广 式 由 Iman (1970) 给 出 . ] 
1.5 连续 型 随机 变量 


到 目前 为 止 ， 本 章 中 所 介绍 的 所 有 随机 变量 有 一 个 共同 的 特征 : 它们 可 能 的 取 
值 是 可 列 的 .二 项 分 布 随 机 变量 的 可 能 取 值 是 0,1,2,3 ,4,…,n -1,n; 而 其 他 值 则 取 
不 到 .离散 均匀 分 布 的 可 能 取 值 是 1,2,3,…,N， 对 于 在 前 面 定义 和 例 题 中 引入 的 随 
机 变量 ， 类 似 的 可 列 值 都 可 以 写 出 . 

这 些 可 列 值 可 能 是 无 限 长 的 ， 比 如 在 一 个 试验 中 ， 随 机 变量 X 等 于 一 只 猴子 在 
最 后 按 “ 对 ” 钮 且 拿 到 奖品 之 前 按 “ 错 ” 钮 的 次 数 ， 那 么 ， 如 果 第 一 次 按 的 就 是 
“对 ” 钮 ， 则 X=0， 或 者 如 果 这 只 猴子 找到 “对 ” 钮 比较 困难 ，X 也 可 能 等 于 1000. 
理论 上 ， 这 只 猴子 在 最 后 按 “ 对 ” 钮 之 前 选择 按 “ 错 ” 钮 的 次 数 是 没有 上 限 的 ， 尽 
管 这 种 可 列 值 会 无 限 地 长 ， 我 们 还 是 可 以 列 出 X 的 所 有 可 能 取 值 ， 无 限 长 的 可 列 值 
是 这 个 模型 的 一 个 特征 ， 而 并 非 这 个 例子 和 很 多 情况 下 的 实际 试验 真得 如 此 ， 因 为 
很 多 实际 因素 ， 比 如 说 猴子 的 最 终 死亡 、 研 究 经 费 的 缺乏 或 者 试验 者 的 试验 热情 的 
减少 ， 都 会 使 实际 试验 不 可 能 延长 到 近似 荒 雇 的 那 一 步 ， 然 而 ， 模 型 是 合理 的 ， 且 
模型 中 的 随机 变量 可 以 有 无 穷 多 的 取 值 . 


离散 型 随机 变量 


一 个 随机 变量 的 可 能 取 值 是 可 列 的 ,更 确切 表述 方式 是 : 随机 变量 的 可 能 取 
值 与 部 分 或 全 部 正 整数 之 间 存 在 着 一 一 对 应 (one-to-one correspondence). 这 意味 
着 对 随机 变量 的 每 一 个 可 能 取 值 存在 唯一 的 正 整 数 与 它 对 应 ， 且 这 个 正 整数 不 与 
随机 变量 除 此 之 外 的 其 他 可 能 值 相 对 应 ， 具 有 这 种 性 质 的 随机 变量 称 为 是 离散 型 
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随机 变量 ， 目 前 我 们 考虑 的 所 有 随机 变量 都 是 离散 的 ， 尽 管 如 此 ， 前 面 已 证 明 过 
的 一 些 定理 却 适用 于 所 有 的 随机 变量 ， 即 使 我 们 仅 对 离散 型 随机 变量 证 明了 它们 . 

定义 1.5.1 称 一 个 随机 变量 X 是 离散 (discrete) 的 随机 变量 ， 如 果 义 的 可 能 
取 值 与 部 分 或 全 部 自然 数 之 间 存 在 着 一 一 对 应 关系 . 

离散 型 随机 变量 的 分 布 函数 总 是 一 个 阶梯 函数 (step function)， 即 它 的 图 形 看 上 
去 像 楼 梯 的 一 串 台 阶 ， 尽 管 这 些 台 阶 可 能 会 不 均匀 ， 甚 至 可 能 会 有 无 穷 多 步 台阶 . 
如 果 这 个 图 形 的 某 一 部 分 是 逐渐 连续 上 升 ， 而 不 是 旦 阶梯 上 升 的 ,那么 相应 的 随机 
变量 就 不 是 离散 的 . 


连续 型 随机 变量 


如 果 一 个 分 布 函数 没有 阶梯 ， 上 升 的 地 方 都 是 逐渐 连续 上 升 的 ， 则 称 这 个 分 布 
函数 是 连续 的 (continuous) ， 与 这 个 分 布 函 数 相对 应 的 随机 变量 称 为 连续 型 随机 变 
量 (continuous random variable) . 图 1-5 是 一 个 连续 型 分 布 困 数 的 图 形 . 

F(x) 


Lo- 


图 1-5 EZRA REE 


说 一 个 分 布 函数 没有 阶梯 ， 即 是 说 不 存在 这 样 的 两 条 水 平 线 ， 它 们 与 图 形 的 交 
点 在 水 平 轴 上 的 值 是 相同 的 .也 就 是 说 ， 若 一 个 分 布 函 数 存在 阶梯 ， 则 至 少 可 以 作 
出 这 样 的 两 条 线 ， 比 如 说 高 是 p, 和 p,， 两 者 非常 接近 以 至 于 它们 与 分 布 晴 数 图 形 的 
交点 在 水 平 轴 上 的 值 是 相同 的 .这 实际 上 是 描述 了 找 分 位 数 的 图 形 法 ， 可 以 说 在 分 
布 电 数 中 车 有 一 个 阶梯 ， 那 么 至 少 存在 两 个 彼此 相同 的 分 位 数 x, 和 x,; 相反 地 ， 如 
果 没 有 精确 相等 的 两 个 分 位 数 ， 那 么 这 个 分 布 函 数 就 没有 阶梯 ， 即 栖 数 是 连续 的 . 
这 就 引出 连续 型 随机 变量 的 如 下 定义 . 

定义 1.5.2 称 一 个 随机 变量 X 是 连续 型 随机 变量 ， 如 果 不 存 在 X 的 两 个 相等 
的 分 位 数 x, 和 x,， 其 中 p p 或 等 价 地 ， 称 XX 是 连续 型 随机 变量 ， 如 果 对 所 有 的 
数 x,P(REx) 等 于 P(X <x). 
例 1.5.1 
图 1-6 中 的 分 布 函数 是 连续 型 的 分 布 函数 ， 且 任何 一 个 以 F(Cx) 为 分 布 函 数 的 随机 变 
量 都 是 连续 型 随机 变量 .典型 的 连续 型 随机 变量 包括 时 间 、 高 度 、 距 离 、 体 积 的 测 


量 等 等 . E [53| 
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F(x) 


图 1-6 连续 型 分 布 函数 

事实 上 ， 实 际 的 随机 变量 没有 连续 的 ， 因 为 它们 观测 值 都 是 某 些 测量 的 结果 ， 测 量 
工具 在 区 分 两 个 值 时 的 能 力也 是 有 限 的 .连续 型 随机 变量 可 以 在 理论 上 存在 ， 如 在 
一 个 实际 试验 的 模型 中 ， 而 有 时 即使 知道 随机 变量 是 离散 的 ， 我 们 也 倾向 于 假定 它 
是 一 个 连续 型 随机 变量 ， 如 下 面 的 例 1. 5. 2. 
例 1. 5. 2 
赛马 跑 完 一 英里 赛程 所 需 的 时 间 是 一 个 连续 的 量 ， 因 为 时 间 一 般 是 一 个 连续 的 量 . 
然而 在 实际 中 ， 时 间 是 以 不 到 1⁄5 秒 为 最 小 测量 单位 的 ， 一 匹 马 跑 完 两 场 比 赛 所 用 
的 时 间 〈 即 测量 时 间 ) 相同 是 不 太 常见 的 .时 间 长 度 确切 相等 的 概率 是 0， 因 此 把 
比赛 的 精确 时 间 假 设 成 连续 的 是 合理 的 ， 这 个 时 间 近 似 等 于 比赛 的 测量 时 间 ， 而 比 
赛 的 测量 时 间 是 离散 型 随机 变量 .如果 两 匹 马 在 同一 场 比赛 中 ,领先 于 其 他 所 有 的 
马 以 相同 的 测量 时 间 跑 过 终点 线 ， 那 么 比赛 的 胜 者 将 通过 两 匹 马 冲 过 终点 线 时 所 拍 
摄 的 照片 来 分 析 决 定 。 这样 来 确定 实际 的 获胜 者 很 少 会 失误 ， 尽 管 赛马 比赛 可 能 会 
出 现 两 个 或 多 个 测量 时 间 上 看 上 去 相同 ， 但 比赛 的 次 序 仍旧 可 以 确定 ， 这 说 明 即 使 
随机 变量 (测量 时 间 ) 是 离散 的 ， 也 可 以 作为 实际 连续 时 间 的 一 种 近似 . E 
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续 型 的 分 布 函数 来 逼近 ， 这 样 ， 离 散 型 随机 变量 中 的 有 关 简 单方 法 就 可 用 来 近似 计 
算 所 要 的 一 些 概率 结果 .常用 的 两 个 连续 型 分 布 是 正 态 分 布 (normal distribution) 和 

X 分 布 (chi-squared distribution ， 读 作 卡 方 分 布 ). 


正 态 分 布 


下 面 分 布 函数 的 定义 或 许 会 使 那些 对 初等 微 积分 不 太 了 解 的 人 感到 吃惊 ， 然 而 ， 
这 无 需 担 优 ， 因 为 我 们 已 制定 好 了 它 的 分 布 函数 表 ， 这 样 的 表 (MEA) 在 大 多 数 
统计 教材 中 都 可 以 找到 ; 不 仅 如 此 ， 大 多 数 电脑 里 的 统计 程序 或 软件 需要 时 都 可 以 
计算 分 位 数 和 概率 . 

定义 1.5.3 设 X 是 一 个 随机 变量 , 称 X 服 从 正 态 分 布 ， 如 果 它 的 分 布 函 数 具 
有 如 下 形式 : 


FW PAS) = fË se Nay (1) 


其 中 ， 可 以 证 明 (用 微 积分 ) 参数 和 o 分 别 是 XX 的 均值 和 标准 差 . 标准 正 态 分 布 
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( standard normal distribution) 是 对 应 人 =0,c =1 的 正 态 分 布 . 

正 态 分 布 函数 的 值 不 能 直接 计算 出 ， 所 以 表 Al 可 用 来 近似 计算 与 正 态 分 布 有 关 的 
概率 . 表 Al 给 出 了 标准 正 态 分 布 的 1000 个 分 位 数 . 利用 下 面 这 个 未 证 明 的 定理 中 的 等 
式 ， 我 们 可 在 表 Al PRAHA u, HEI o° 的 正 态 分 布 的 分 位 数 . 

定理 1. 5. 1 对 于 给 定 的 值 P， 设 x, 是 均值 为 k、 方 差 为 a” 的 正 态 分 布 的 p 分 
位 数 ，z, 是 标准 正 态 分 布 的 p 分 位 数 ， 则 分 位 数 x, 可 通过 z 由 如 下 线性 关系 获得 : 

Xp = H + 0zp (2) 
类 似 地 ，z, 也 可 通过 x, 由 如 下 线性 关系 获得 : 
(3) 


例 1.5.3 
设 Z 服 从 标准 正 态 分 布 ， 使 用 表 Al 来 计算 Z 不 超过 1. 42 的 概率 .由 表 Al， 我 们 得 
到 
P(Z<1.4187) = 0.922 


H 
P (Z < 1.4255) = 0.923 


我 们 简单 地 用 接近 1. 42 的 分 位 数 得 到 

P (Z <1.42) = 0.922 m 
J 1. 5.4 
从 一 群 人 中 随机 选取 一 个 人 的 JR， 设 为 X， 假 设 X 是 均值 为 100， 标 准 差 为 15 的 正 
态 分 布 ， 我们 要 计算 和 大 于 125 的 概率 ， 由 于 

P(X>125) = 1 — P(X <125) 
这 就 归结 于 求 P(X<125) ， 对 应 于 分 位 数 x, =125, H (3) 式 可 以 得 到 标准 正 态 
分 布 的 分 位 数 z,， 
xp— u _ 125 — 100 


pss esse —— 1.6667 


再 由 表 Al 可 以 看 到 , 若 z =1.6667, M) p =0.952. Ee 125 是 XX 的 0.952 分 位 数 . 
P(X<125)=0.952 P (X > 125) = 0.048 
故 所 求 的 概率 是 0. 048. 
为 了 获得 上 1 百 分 位 数 ， 也 称 作 第 99 个 百 分 位 数 ， 我 们 需要 求 mw， 其 中 
P (X < xg) = 0.99 
这 样 由 表 Al, z =2.3263，mw 可 由 (2) 式 得 到 
X099 = u + oz00%= 100 + 15(2.3263) = 135 
因此 ， 随 机 选取 这 人 的 IQ 小 于 135 的 概率 是 0. 99. = 
@l 1. 5. 5 
铁路 公司 观察 了 一 段 时 间 发 现 , 乘 某 一 列车 的 人 数 X 似 乎 服从 均值 为 540 ,标准 差 
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为 32 的 正 态 分 布 ， 如 果 想 以 95% 的 概率 保证 每 位 乘客 都 有 座位 ， 那 么 公司 应 该 在 
这 辆 列车 上 提供 多 少 个 座位 呢 ? 

实际 上 ， 我 们 要 计算 第 95 个 百 分 位 数 ， 由 (2) 式 可 得 

X095 三 从 十 0z095 = 540 + 32(1.6449)= 593 

其 中 ，zw 由 表 Al 得 到 ， 即 这 个 公司 在 这 辆 列车 上 需要 提供 593 个 座位 ， 才 能 以 
95% 的 概率 保证 ， 在 列车 的 任何 一 次 运行 中 每 一 个 乘客 都 有 座位 . m= 

例 1. 5.5 中 随机 变量 X 实 际 上 是 一 个 取 非 负 整 数 的 离散 型 随机 变量 ， 严 格 地 说 ， 
X 不 可 能 服从 正 态 分 布 ， 而 且 对 X 的 分 布 也 很 难 找到 一 个 理想 的 离散 分 布 ， 因 此 对 
它 做 正 态 允 近 一 部 分 是 为 了 简便 ， 也 有 一 部 分 是 出 于 需要 . 在 其 他 的 问题 中 ， 或 许 
知道 一 个 与 数据 吻合 得 较 好 的 离散 分 布 ， 但 为 了 计算 方便 ， 我 们 还 是 会 使 用 正 态 逼 
近 ， 使 用 正 态 逼近 的 理论 根据 通常 由 中 心 极 限定 理 来 保证 . 


中 心 极限 定理 


所 谓 的 中 心 极限 定理 可 能 有 多 种 形式 ， 所 有 的 形式 有 一 个 共同 的 特点 ， 就 是 在 
一 定 的 条 件 下 ， 一 些 随机 变量 的 和 能 够 用 正 态 分 布 副 近 . 这 个 定理 说 : 随 着 被 求 和 
的 随机 变量 的 个 数 的 增 大 ( 即 趋 于 正 无 穷 )， 并 在 满足 其 他 一 般 条 件 的 情况 下 ,一些 
随机 变量 的 和 将 趋 于 正 态 分 布 . 这 些 “ 其 他 的 一 般 条 件 ” 可 以 有 多 种 描述 方式 ， 由 
此 产生 了 不 同形 式 的 中 心 极限 定理 .对 这 个 定理 的 详细 讨论 已 超出 了 本 书 的 范围 . 

定理 1. 5.2 (中 心 极 限定 理 ，Central Limit Theorem) it Y, Æ n MYE E 
X ,X,，,…,X, RIA, u, 是 Y, 的 均值 ，o; 是 Y, 的 方差 .在 一 般 较 容易 满足 的 条 件 下 ， 
当 随 机 变量 的 个 数 ” 趋 于 无 穷 大 时 ， 下 面 随机 变量 的 分 布 函数 

Y, — Mn 


On 
趋 于 标准 正 态 分 布 图 数 . 

在 实际 中 ， 求 和 的 随机 变量 的 个 数 不 会 达到 无 穷 大 ,但 是 中 心 极 限定 理 的 价值 
在 于 ， 在 定理 成 立 的 情形 中 ， 只 要 半 比 较 “ 大 ”, ESBE “WAW, KE 
“相当 地 好 ”和 比较 “大 ”都 是 主观 的 说 法 . 所 以 在 实际 应 用 正 态 台 近 时 ， 有 很 多 说 
法 和 观点 ， 通 常 如 果 n 大 于 30 时 ， 正 态 盈 近 就 比较 满意 了 , 但 有 时 当 nn 像 5 或 10 一 
样 小 时 ， 正 态 和 逼近 还 是 相当 好 的 . 

下 面 例 1. 5. 6 将 说 明正 态 通 近 在 二 项 分 布 中 很 好 的 应 用 . 

例 1.5.6 
设 Y, 是 一 个 服从 均值 为 np、 方 差 为 mpg ( 见 定理 1.4.4) 二 项 分 布 的 随机 变量 ( 见 
定义 1.3.5) ， 则 Y, 可 以 看 作 n 个 相互 独立 但 都 服从 n=1 的 二 项 分 布 的 随机 变量 之 
和 (参见 例 1.4.12)， 对 较 大 的 nx， 随机 变量 

Y, — np 

VHpg 
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的 分 布 近似 服从 标准 正 态 分 布 ， 等 价 地 说 ， 对 较 大 的 n, Y, 的 分 布 函数 能 够 用 均值 
为 np、 方 差 为 npa 的 正 态 分 布 来 通 近 (定理 1.5.1). G 
下 面 的 例子 说 明 中 心 极 限定 理 的 另 一 个 应 用 ， 在 第 5 章 中 还 会 用 到 它 . 
例 1. 5.7 
考虑 一 个 抽样 方案 ， 从 1 至 NN 这 NN 个 整数 中 无 放 回 地 随机 抽取 nn 个 整数 设 X 是 
第 ;次 取出 的 整数 ， 且 
Y, = Xi + X> + : : - + X, 
是 个 选 出 整数 的 和 ， 对 于 较 大 的 m 和 N， 下 式 随 机 变量 的 分 布 函 数 
$s: n(N + 1) 
r SS ESE 
(mna) 
12 
可 以 用 标准 正 态 分 布 函数 来 逼近 (定理 1.4. 5)， 换 句 话说 ，Y, 的 分 布 函数 能 够 用 
均值 为 n(N+1)/2、 方 差 为 n(N +1)(N - n)/12 的 正 态 分 布 函数 来 逼近 (EM 
1: 5:13: m 


x 分 布 

中 心 极限 定理 之 所 以 成 为 非常 有 用 的 定理 ， 是 因为 它 具 有 广泛 应 用 ， 同 时 在 某 
种 程度 上 ， 它 也 说 明了 正 态 逼近 的 用 处 ， 所 以 正 态 分 布 是 一 个 十 分 有 用 的 分 布 ， 其 
他 和 正 态 分 布 有 关 的 分 布 由 此 也 变 得 很 重要 ， 比 如 说 x 分布 . 

下 面 定义 的 x 分 布 函数 中 用 到 了 微 积分 中 的 “积分 ”符号 和 “Gamma 函数 ” 
T(k/2)， 这 些 符号 不 需要 解释 其 至 不 用 理解 ， 因 为 x 分 布 函 数 的 值 已 制 成 了 表 (W 
表 A2) ， 无 论 什 么 时 候 需 要 用 到 分 布 函 数 的 值 ， 你 都 可 以 使 用 它 . 电脑 里 的 很 多 统 
计 程 序 和 软件 需要 时 都 可 以 计算 x 分 布 分 位 数 和 概率 . 

定义 1.5.4 随机 变量 X 称 为 服从 自由 度 为 k 的 Xx 分 布 (chi-squared distribution 
with k degrees of freedom), ， 如 果 问 的 分 布 函数 满足 

x tk/2)-1le-y/2 
Fe) = PCX< 力 = | Sar 2 若 x>0 
=0 若 x 委 0 (4) 

(4) 式 的 分 布 函 数 表明 , x 分 布 的 随机 变量 只 能 取 非 负 值 ， 因 为 若 x 为 负 ， 则 
F(x) =0. 自由 度 上 是 一 个 参数 ， 它 的 选取 一 般 局 限于 1,2,3 等 整数 ， 对 于 不 同 的 参 
数 丰 ， 分 布 函数 也 是 不 同 的 ， 表 A2 给 出 了 一 些 x 随机 变量 选 定 的 分 位 数 , 上 取 1,2,3， 
直到 30， 也 有 部 分 大 于 30 的 大 值 . 当 上 大 于 100 时 ， 可 以 通过 中 心 极限 定理 来 获得 
近似 的 分 位 数 ， 本 节 中 的 后 面部 分 将 给 予 介 绍 . 

在 一 些 数理 统计 的 入 门 书 中 都 列 有 结果 : 如 果 X 是 一 个 服从 自由 度 为 的 x 分 
布 的 随机 变量 ,那么 X 的 均值 和 方差 分 别 为 : 
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E(X)=k G) 
Var (X) = 2k (6) 


下 面 这 个 定理 的 证 明 可 在 Freund( 1962 , p. 194 ) 中 找到 . 
定理 1.5.3 设 XX,X,,…,X,， 是 上 个 独立 同 分 布 的 标准 正 态 随机 变量 ，Y 是 X, 
的 平方 和 
Y = X; + X; +- - + X (7) 


那么 Y 服 从 自由 度 为 的 x 分 布 . 


例 1.5.8 

一 位 儿童 心理 学 家 询问 了 100 个 儿童 ， 了 解 他 们 更 喜欢 玩 两 辆 玩具 卡车 中 的 哪 一 辆 ， 
这 两 辆 卡车 一 个 是 红色 的 ， 另 一 个 是 绿色 的 ， 其 他 方面 一 模 一 样 . 这 位 心理 学 家 关 
心 的 是 儿童 对 颜色 是 否 有 偏好 . 

令 随 机 变量 X 等 于 选择 绿色 卡车 的 儿童 数 ， 结 果 42 个 儿童 选择 了 绿色 的 卡车 ， 
其 余 58 个 选择 了 红色 的 卡车 .这 个 模型 中 假设 是 “没有 偏好 ”， 所 以 X 应 服从 均值 
为 np =50, 方差 npa =25 的 二 项 分 布 ， 这 时 我 们 可 以 考虑 用 XX 分 布 函 数 的 正 态 双 
近 ， 所 以 

X — 50 
5 
近似 于 标准 正 态 随机 变量 .然而 ， 心 理学 家 关心 的 是 两 个 方面 的 决定 性 差异 ， 即 她 
想 知 道 X 是 否 比 50 小 很 多 或 大 很 多 ， 所 以 本 质 上 她 用 了 偏差 的 平方 ， 即 实际 考察 
的 是 随机 变量 
,_ (x — 50 
e- 


5 

因为 它 可 以 与 自由 度 为 1 的 好 随机 变量 进行 比较 .在 这 个 试验 中 ，X = [ (42 - 
50)/5]° =2. 56， 在 表 A2 中 使 用 内 插 法 ， 且 k=1 时 ， 可 得 到 一 个 比 2.56 小 的 值 
(相应 于 一 个 接近 50 的 X 的 值 ) 的 概率 约 为 0.88， 所 以 心理 学 家 得 出 结论 : 这 里 的 儿 
童 有 对 颜色 偏好 的 倾向 ，( 这 种 得 出 结论 的 方法 在 后 面 的 章节 中 将 进行 详细 讨论 . ) 图 
在 例 1.5.8 中 ， 随 机 变量 (X-50)75S 的 分 布 函数 近似 于 标准 正 态 分 布 函 数 ， 所 以 
X* 的 分 布 近似 于 自由 度 为 1 的 x 分 布 ， 所 求 的 概率 可 由 计算 正 态 分 布 阴 数 的 上 下 尾 

概率 获得 ， 即 


e a X—50 
P(X*<( L65 = P Í 1.6 < s <+16) 
由 表 A2 可 得 到 下 尾 的 概率 ， 应 该 等 于 由 表 Al 得 到 的 上 尾 概 率 ， 两 个 概率 间 的 唯一 不 
同 在 于 两 表 中 使 用 的 内 插 法 ， 如 果 自 由 度 大 于 1， 那 么 表 Al 就 不 能 用 来 替代 表 A2. 
例 1.5.9 
续 例 1. 5.8， 心 理学 家 有 两 部 相同 的 玩具 电话 ， 一 部 是 白色 的 ， 另 一 部 是 蓝 色 的 ， 她 
让 25 个 儿童 选择 一 部 玩 ， 其 中 有 17 名 儿童 选择 了 白色 的 电话 ， 另 外 8 名 选择 了 蓝 色 的 . 


设 Y 等 于 选择 白色 电话 儿童 数 的 随机 变量 ， 因 为 在 没有 颜色 偏好 的 假设 下 ， 
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Y — np _ Y — (1/2X25) 
Vnpq 5/2 
近似 于 一 个 标准 正 态 随 机 变量 .随机 变量 
Y — (1/2)(25) Y 
y* -( Q £2 )) 
可 与 自由 度 为 1 的 x 随机 变量 进行 比较 . 由 于 Y=17， 那么 Y* =3.24， 在 表 A2 中 
运用 内 插 法 ， 可 求 得 自由 度 为 1 的 x 分 布 随机 变量 小 于 3.24 的 概率 约 为 0.92， 因 
此 ， 如 果 每 一 个 玩具 等 可 能 选中 的 假设 是 合理 的 ， 那 么 出 现 偏离 期 望 值 12.5 这 么 大 
偏差 的 概率 大 约 只 有 8%. 
因为 例 1.5. 8 和 本 例 中 的 试验 都 是 为 同一 个 目的 设计 的 ， 那么 ， 应 该 通过 某 一 
方式 来 组 合 这 些 结果 ， 一 个 合理 的 想法 是 将 X 和 Y" 看 作 相 互 独立 的 随机 变量 ， 对 
于 六 和 六 的 下 列 组 合 
W=X*+ Y* 
利用 定理 1.5.3， 则 W 的 分 布 函数 可 以 由 自由 度 为 2 的 RRE. HA 
W = 2.56 + 3.24 = 5.80 
由 表 A2 和 内 播 法 可 得 ， 自 由 度 为 2 的 x 随机 变量 大 于 5. 80 的 概率 仅 为 0. 06. 
在 这 个 例子 中 ， 通 过 结合 两 项 研究 中 的 信息 来 获得 更 多 关于 儿童 中 存在 颜色 偶 


好 的 信息 . 
需要 注意 的 是 : 若 定义 Y 为 偏好 蓝 色 电话 的 儿童 数 (代替 本 例 中 的 Y)， 则 Y* 
的 取 值 不 变 ， 因 为 Y 对 均值 的 偏差 取 了 平方 ， 所 以 消除 了 差 蜡 的 方向 影响 . m 


例 1.5.9 中 ， 两 个 近似 x 的 随机 变量 相 加 ， 且 它们 的 和 近似 于 一 个 自由 度 为 2 
的 x 随机 变量 .一般 来 说 ， 这 种 组 合 独 立 x 随机 变量 的 方法 是 可 行 的 ， 有 关 这 种 方 
法 更 多 的 讨论 可 参见 Radhadkrishna( 1965 ) 和 Nelson( 1966). 

下 面 的 定理 可 在 Freund(1962 ,p194) 中 找到 . 

定理 1.5.4 假设 X,,X,,…,X, 分 别 是 自由 度 为 ,k,,…,k, 的 独立 x 随机 变量 . 
W 记 为 X; 的 和 ， 则 W 为 自由 度 为 k 的 x 随机 变量 ， 其 中 

k=k +k, + ::: +k, 

本 书后 面 将 应 用 定理 1.5.4 来 通 近 几 个 随机 变量 和 的 分 布 函数 ， 其 中 ， 随 机 变量 
假设 相互 独立 且 都 近似 于 x 随机 变量 . 

由 于 自由 度 为 的 x* 随机 变量 可 认为 是 k 个 独立 且 服 从 自由 度 为 1 的 x 分 布 随 
机 变量 的 和 ， 所 以 它们 满足 中 心 极限 定理 中 的 条 件 . 由 (5) 和 (6) 式 可 得 到 月 由 
EH k BJ) y 随机 变量 的 均值 和 方差 分 别 为 k 和 2k， 因 此 ， 如 果 W 是 自由 度 为 的 xX 
随机 变量 ， 则 当 大 较 大 时 ， 下 式 
的 分 布 函 数 到 近 于 标准 正 态 分 布 函数 ， 由 定理 1.5. 1 p| HI, # z, 是 来 自 表 Al 的 分 位 
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数 ， 对 于 较 大 的 上 ， 相 应 于 表 A2 中 的 分 位 数 w ， 可 由 下 式 来 近似 


wp = k + V2kz, (9) 
注意 到 ， 近 似 式 (9) 没有 表 A2 底部 给 出 的 两 个 近似 式 
w, = Mz, + V2k — 1} (10) 
或 
2 2 
w=k(1-2+y 2) (11) 
精确 . 
习题 
1. ”假设 Z 是 标准 正 态 随 机 变量 ， 求 : 
(a) P(Z<0). (b) P(Z<1.96). (c) P(Z>1). 
(d) P(-L<Z<1)., (e) P(-4<Z<0). (f) Z 的 上 四 分 位 数 . 
2. ”假设 X 是 具有 均值 为 0.5， 标准 差 为 3 的 正 态 随机 变量 ， 求 : 
(a) P(X<0). (b) P(X<1). (c) P(X> -0.5). 
(d) P(-1<X<1). (e) X 的 中 位 数 . (f) 了 的 上 四 分 位 数 . 


3. 是 某 一 高 中 运动 员 跑 1 英里 所 需要 的 时 间 (单位 : 分 ) ,假设 X 服 从 均值 为 4.3， 标 准 
差 为 0.05 的 正 态 分 布 ， 求 该 运动 员 在 年 度 田径 运动 会 上 打破 学 校 4. 15 分 钟 记录 的 概率 
是 多 少 ? 

4 令 X 是 向 一 个 大 保险 公司 至 少 索赔 过 一 次 的 保险 客户 的 数量 ， 假 设 有 2000 位 保险 客户 
且 每 位 客户 全 年 索赔 至 少 一 次 的 概率 为 0.2， 求 任何 给 定 的 一 年 中 ， 索 赔 的 客户 数 不 超 
过 500 的 概率 ? 

5. ”如 果 某 一 班级 中 学 生 的 体重 近似 于 均值 为 160、 方 差 为 400 的 正 态 分 布 ， 那 么 体重 秤 的 
最 高 刻度 是 多 少 才能 使 99% 的 学 生 能 够 称 他 们 自己 的 体重 ? 

6 ”假设 Y 是 参数 n=60，p =0.5 的 二 项 随机 变量 ， 试 估计 随机 变量 

(Y — np? 
np(1 — p) 
超过 5 的 概率 . 
7. ”假设 W 是 自由 度 为 k 的 x 随机 变量 , R: 
(a) k=4BF, W 的 0.95 分 位 数 . 
(b) k=8 HF, W 的 0.95 分 位 数 . 
(c) k=200 RF, W 90.95 分 位 数 . 

8， ”假设 X,Y,Z 是 独立 的 x 随机 变量 ， 自 由 度 分 别 为 3.2、3. 求 W 超 过 15 的 概率 ， 其 中 
W=X+Y+Z. 

9. ， 设 X 是 在 为 学 校 捐款 活动 中 捐款 的 人 数 ， 假 设 有 500 人 参加 了 这 次 活动 ， 且 每 个 人 捐款 
的 概率 为 0. 15， 它 们 相互 独立 ， 试 估计 P(80 <X). 

10. 设 X 为 十 月 份 光 顾 得 克 萨 斯 州 Plains 市 的 DQ 冰 琪 淋 店 至 少 1 次 的 人 数 ， 假设 Plains 市 有 
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2000 居民 ， 且 每 个 人 去 DQ 店 的 概率 为 0 25 ， 彼 此 独立 . 试 估 计 P(460 <X <540). 

一 名 篮球 运动 员 投篮 100 次 有 43 次 命中 ， 如 果 此 运动 员 真 正 的 投篮 命中 率 是 60% ， 试 
求 出 他 投篮 命中 不 超过 43 次 的 概率 . 

10 个 公司 根据 利润 从 1 (最 多 利润 ) 到 10 (最 少 利润 ) 排名 ， 从 这 10 个 公司 中 随机 取 
出 4 个 ， 假 设 X 是 所 选 4 个 公司 的 排名 和 : 

(a) 如 果 F(x) 是 XX 的 分 布 函 数 ， 求 F(14). 

(b) 用 正 态 逼近 求 F(14) 的 近似 值 . 


思考 题 


1: 


假设 W 是 自由 度 为 100 的 x 随机 变量 ， 试 用 近似 式 (9), (10), (11) 求 得 W 的 0.95 

分 位 数 近 似 值 ， 并 与 由 表 A2 查 得 的 精确 值 做 比较 . 

假设 X 是 参数 n=100, p =0.3 的 二 项 随机 变量 ， 利 用 表 Al 和 A2， 估 计 
P(20< X <40) 
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如 果 得 克 萨 斯 理工 大 学 所 有 录取 的 研究 生 中 有 75% 是 在 得 克 萨 斯 理工 大 学 的 研究 生 招 生 
计划 中 ， 并 且 所 有 申请 学 生 中 有 40% 的 学 生 被 录取 ， 试 求 申 请 学 生 中 被 得 克 萨 斯 理工 大 
学 录取 但 属 计划 外 的 学 生 的 百分比 . 

投掷 一 枚 均匀 硬币 8 次 ， 如 果 已 知 8 次 投掷 中 至 少 有 两 次 是 正面 朝 上 的 ， 试 求 恰 有 两 次 
正面 朝 上 的 概率 . 

投掷 5 个 骨 子 ， 设 X 为 这 5 个 股子 上 数字 (1 到 6) 的 和 BERTE (MEA 
山子 每 次 投 毛 等 概率 显示 1 到 6)， 且 彼此 独立 ， 求 XX 的 均值 和 方差 


二 维 随机 变量 (X,Y) H (0,0) 的 概率 是 1/4, 取 (1,1) 的 概率 是 1/2, 取 (2,0) 的 
概率 是 1/4， 
(a) 求 X 和 YY 的 协 方差 . (b) XAI YIRA? 请 解释 ， 


某 俱乐部 有 8 个 成 员 ， 从 成 员 中 选取 经 理 、 副 经 理 、 秘 书 和 会 计 的 方式 有 多 少 种 ? 
小 吃 新 品牌 Yummies 与 品牌 A 和 品牌 B 在 进行 投标 竞争 ， 给 4 个 宴会 提供 了 等 量 的 3 种 
小 吃 ， 然 后 比较 4 个 宣 会 后 的 剩余 量 ， 假 设 Y 是 品牌 Yummies 被 评 为 最 受 欢迎 小 吃 的 次 
数 ， 如 果 在 偏好 上 没有 差别 ， 则 Y 服从 参数 是 n=4,，p =1/3 的 二 项 分 布 . 


(a) mih Y 的 分 布 图 . (b) 求 Y 的 下 四 分 位 数 . 
(c) 求 Y 的 四 分 位 极 差 . (d) 求 Y 的 均值 
(e) 求 Y 的 标准 差 . (f) 求 Y 不 大 于 2 的 精确 概率 . 


(g) 运用 正 态 允 近 来 估计 Y 不 大 于 2 的 概率 .并 与 (f) 中 的 值 做 比较 . 

顾客 从 6 个 产品 商标 中 等 可 能 地 选择 任 一 个 ， 标记 “商标 1",“ 商 标 2”， 依 此 类 推 . 假 
设 XX 是 选择 的 商标 号 ， 若 选择 的 商标 号 是 前 三 个 中 的 一 个 ， 则 令 Y=3; 若是 后 三 个 中 的 
一 个 ， 则 令 Y=6， 若 选择 的 商标 号 为 偶数 ， 则 令 Z=1; 若 为 奇数 ， 则 令 QZ=2 

(a) 列 出 样本 空间 的 点 . (b) 写 出 样本 空间 上 的 概率 函数 . 


63 | 


[65 | 
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(c) X 服从 什么 分 布 ? (d) 求 Y 的 四 分 位 极 差 . 
(e) 求 Z 的 方差 . (f) 求 X 和 Z 的 协 方差 . 
(g) Y 和 Z 独 立 吗 ? 


12 颗 钻 石 根据 质量 从 1 到 12 排序 ， 现 从 12 颗 中 无 放 回 地 随机 取出 3 W, 假设 X 是 3 颗 
钻石 的 序号 的 和 | 

(a) 样本 空间 中 有 和 多少 点 ? (b) 描述 样本 空间 中 的 任 一 个 点 . 

(c) 求 P(X=3). (d) # f(x) X HRR, R fO). 

(e) # Fx) iÈ X BJ yfi 83k, K F(10). 

(f) 运用 中 心 极限 定理 通 近 FL10) ， 并 将 该 近似 值 和 《〈e) 中 求 得 的 精确 值 进行 比较 . 
某 高 中 毕业 班 前 10 名 学 生 从 1 (最 好 ) 到 10 (第 10 名 ) 排名 ， 假 设 每 一 个 名 次 等 可 能 
排 上 男 学 生 和 女 学 生 ， 且 大 等 于 女 学 生 名 次 的 和 若 前 10 名 都 是 女生 ， 则 X=1+2+ 
3+… +10 =55. 


(a) 样本 空间 中 有 多 少 点 ? (b) 描述 样本 空间 中 的 任 一 个 点 . 
(c) 描述 样本 空间 上 的 概率 两 数 ， (d) 求 P(X=0). 
(e) R P(X=1). (f) 车 f(x) 是 X 的 概率 函数 ， 求 (3). 


(g) 车 F(x) 是 X 的 分 布 函数 , 求 F(3). 

出 生 的 婴儿 中 大 约 49 驳 是 女孩 ，51% 是 男孩 ， 设 一 个 家 庭 中 有 5 个 孩子 . 

(a) 女孩 数 的 期 望 是 多 少 ? (b) 女孩 数 的 中 位 数 是 多 少 ? 

(c) 4 个 男孩 和 1 个 女孩 的 概率 是 多 少 ? (d) 男孩 和 女孩 最 可 能 的 分 布 是 什么 ? 

(e) 为 了 回答 这 些 问 题 ， 你 还 需要 做 哪些 假设 ? 

两 次 独立 地 投 据 一 枚 均匀 山 子 ， 假设 六 是 两 次 点 数 的 平均 数 [ 即 铸 =(X, +X,)/2， 其 中 

X, 和 XX, 分 别 是 第 1 次 和 第 2 次 投 得 的 点 数 ]. 

(a) 求 出 X=2 的 概率 . (b) 画 出 广 的 整个 概率 分 布 条 形 图 . 

(c) Wih X Aat RÉ. (d) SR X WHEA 2. 

(e) 求 F(3) 的 精确 值 . 

(f) 运用 中 心 极限 定理 求 (3) 的 近似 值 ， 并 与 (e) 中 的 值 进行 比较 . 

假设 预定 某 航班 的 人 有 10% 并 没有 乘坐 此 次 航班 ， 正 因为 如 此 ， 航空 公司 为 了 乘 载 尽量 

多 的 人 ， 通 常会 提供 比 飞 机 定员 更 多 的 预定 ， 如 果 飞 机 能 容纳 100 入 ， 试问: MEAE 

能 提供 多 少 预 定 ， 又 有 90% 的 把 握 保证 前 来 的 每 个 预定 的 乘客 能 搭乘 此 次 航班 ? 

“Texas 彩票 ”的 玩法 是 ， 彩 民 从 1 到 50 数字 中 ， 无 放 回 地 ( 即 数字 不 会 重复 出 现 ) 取 

出 6 个 数字 ， 然 后 彩票 公司 也 从 1 到 50 中 无 放 回 地 随机 抽取 6 个 数 (每 6 个 数字 的 组 合 

等 概率 出 现 )， 彩 民 若 至 少 有 3 个 数字 和 彩票 公司 取出 的 一 样 (不 考虑 数字 顺序 ) ， 则 认 

为 中 奖 . 

假设 XX 是 彩民 取出 的 匹配 数字 的 个 数 ， 如 果 X=3,4,5 或 6 时 ， 则 认为 他 中 奖 . 

(a) 50 个 数字 中 选取 6 个 数字 的 组 合 有 多 少 (不 考虑 数字 取出 的 顺序 )? 若 数 字 随 机 取 
出 ， 则 每 一 组 合 出 现 的 概率 是 多 少 ? 

(b) 求 彩民 取出 的 6 个 数字 和 彩票 公司 随机 取出 的 数字 完全 匹配 的 概率 ， 即 P(X=6) 是 
多 少 ? 

(c) 求 P(X=5) ,P(X=4),P(X=3) 各 是 多 少 ? 
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(d) X 的 概率 分 布 是 什么 ? 概率 分 布 中 的 参数 值 是 多 少 ? 
(e) 在 一 次 结果 公布 中 ， 有 24 1024 张 票 都 恰 有 3 个 数字 正确 ， 你 认为 这 次 彩票 公司 共 
卖 出 去 多 少 张 彩票 ? 
(f) 在 (e) 的 抽取 中 有 12 422 张 票 恰 有 4 个 数字 正确 ， 这 与 恰 有 3 个 数字 相同 的 票数 
相 容 吗 ? 
参加 “让 我 们 做 交易 ”游戏 秀 的 竞 猿 者 有 机 会 获得 一 辆 新 轿车 .她 所 需要 做 的 就 是 从 3 
个 一 样 的 车 库 门 (标号 A,B,C) 中 选择 一 个 正确 的 车 库 门 ， 该 门 后 面 藏 着 汽车 她 选 
FET A. 
在 开车 库 门 A 之 前 ， 主 持 人 Monte Hall 问 她 是 否 需 要 改变 主意 . 为 了 让 游戏 更 精 
彩 ，Monte Hall (知道 车 在 哪 ) 故意 打开 门 B， 每 个 人 都 发 现 车 不 在 里 面 ， 然 后 又 问 她 
是 否 需 改变 主意 选 门 C 而 不 是 A， 此 时 ， 竞 猜 者 应 改变 主意 选 C 吗 ? 
(a) Monte Hall 开车 库 门 B 之 前 , 门 A 是 正确 〈 即 竞猜 者 获得 那 辆 车 ) 的 概率 是 多 少 ? 
(b) Monte Hall 开车 库 门 B 之 后 ， 门 A 是 正确 的 概率 是 多 少 ? P] B 和 门 C 是 正确 的 概 
率 又 分 别 是 多 少 昵 ? 
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Till 


于 


前 一 章 所 介绍 的 概率 论 中 的 概念 并 没有 涉及 整个 概率 论 领域 , 但 这 些 简洁 的 介 
绍 ， 对 于 帮助 我 们 理解 大 多 数 常用 的 非 参 数 统计 方法 中 的 基本 原则 则 是 必需 的 ， 现 
在 我 们 要 架 起 概率 论 与 其 在 数据 分 析 中 的 应 用 之 间 的 桥梁 ， 本 章 将 要 介绍 数据 分 析 
的 基础 学 科 统计 (statistics) 这 一 概念 . 

统计 中 很 多 的 重要 思想 都 要 归功 于 在 应 用 科学 中 处 理 数 据 时 遇 到 困难 问题 的 人 
i, 他们 具有 一 定 的 应 用 数学 能 力 、 一 些 数 学 训练 及 众多 的 常识 .他 们 的 思想 经 过 
长 期 发 展 ， 浓 缩 为 本 章 中 我 们 逐步 所 要 介绍 的 一 些 基 本 概念 . 


2.1 总 体 、 样 本 与 统计 量 


我 们 对 所 居住 的 这 个 世界 的 大 多 数 认识 都 来 源 于 样本 .我 们 在 某 家 和 餐馆 吃 过 一 
次 饭 ， 于 是 会 对 这 家 和 餐馆 的 饭菜 质量 和 服务 水 平 有 一 个 看 法 . 我 们 结识 了 12 个 英国 
人 ， 于 是 感觉 自己 差不多 对 所 有 英国 人 都 有 了 一 定 的 认识 .大 多 数 情况 下 ， 从 样本 
中 获取 的 认识 并 不 准确 ,但 是 ， 运 用 科学 方法 获得 的 样本 却 能 够 提供 关于 整个 总 体 
的 比较 准确 的 信息 . 


试验 


科学 观点 的 形成 常常 源 于 试验 (experiment) 的 框架 、 正如 我 们 在 第 1 章 所 讨论 
的 ， 一 个 试验 就 是 每 一 个 步骤 都 规定 得 很 明确 的 过 程 ， 而 在 试验 之 前 ， 每 一 步 的 结 
果 都 是 未 知 的 . 

检验 一 个 新 药物 治疗 效果 的 试验 由 以 下 几 部 分 组 成 : 选 定 治疗 病人 ， 按 照 规定 
的 步骤 服用 药物 ， 观 察 该 治疗 方案 的 效果 .检验 人 工 产品 质量 的 试验 则 包括 两 部 分 : 
根据 明确 规定 的 步骤 抽取 和 检验 产品 样本 ， 记 录 试 验 结果 . 


总 体 


研究 对 象 的 全 体 所 构成 的 集合 称 为 总 体 ( population)， 总 体 可 以 是 一 组 人 ， 
一 群 动物 ， 或 甚至 是 诸如 来 自 工厂 产品 装配 线 的 零件 之 类 的 无 生命 物体 ， 一些 
总 体 比 较 小 ， 例 如 美国 历届 总 统 组 成 的 总 体 ， 这 种 情况 可 以 考查 整个 总 体 ， 有 
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一 些 总 体 比 较 大 ， 像 得 克 萨 斯 州 的 人 口 数 ; 或 基本 上 是 无 穷 的 ， 比 如 所 有 人 类 
WAH, ， 这 种 情况 下 对 于 总 体 的 任何 研究 都 只 能 基于 从 中 抽取 的 样本 . 


样本 


总 体 中 某 些 元 素 的 集合 称 为 样本 (sample). 根据 不 同 的 获取 方法 ， 样 本 分 为 下 
面 几 个 不 同类 型 ， 方 便 样 本 (convenience sample) 是 一 些 最 容易 获得 元 素 的 集合 ， 
例如 在 街 上 采访 的 市 民 ， 或 电视 电话 调查 .我们 不 太 可 能 从 这 种 样本 中 获得 总 体 参 
数 的 精确 估计 ， 另 一 方面 ,概率 样 本 (probability sample) 则 能 够 相对 精确 地 描述 总 
体 的 未 知 参 数 ， 概 率 样本 要 求 总 体 中 每 一 个 元 素 都 有 已 知 的 非 零 概率 ， 本 书 中 所 考 
虑 的 概率 样本 是 随机 样本 (random sample) ， 这 个 概念 我 们 将 在 本 节 的 后 面 定义 . 


目标 总 体 与 样本 总 体 


假如 一 名 心理 学 家 想 要 研究 不 停 地 打 断 一 个 人 的 睡眠 对 他 情绪 稳定 的 影响 ， 
他 所 考虑 的 总 体 应 是 当代 的 所 有 人 .为 了 进行 试验 ， 他 在 大 学 校 报 上 刊登 广告 来 
招聘 所 需要 的 有 偿 志 愿 者 ， 他 所 抽取 的 样本 很 难 具有 代表 性 ， 因 为 这 些 志愿 者 都 
是 大 学 生 ， 来 自 同一 所 大 学 ,年 龄 范围 相当 狭窄 ， 并 且 有 某 种 相似 的 性 情 促 使 他 
们 回应 报纸 上 的 广告 ， 并 应 聘 成 为 某 项 人 体 试 验 研究 的 志 砷 者 . 但 是 ， 由 于 很 多 
实际 原因 ， 比 如 有 限 的 研究 基金 和 时 间 ， 他 不 得 不 使 用 这 种 类 型 的 样本 ,否则 就 
得 放弃 整个 试验 . 因此 有 两 种 总 体 是 值得 一 提 的 : 研究 的 目标 总 体 和 实际 样本 的 
总 体 . 

我 们 需要 从 中 获取 信息 的 总 体 称 为 目标 总 体 (target population), ， 而 从 中 抽样 的 
总 体 成 为 样本 总 体 ( sample population). 上 面 的 例子 中 考虑 当代 人 类 的 全 体 作为 目 
标 总 体 ， 而 来 应 聘 的 志愿 者 是 样本 总 体 ， 所 有 的 试验 者 都 只 能 基于 样本 总 体 来 研究 
问题 ， 而 试验 的 有 效 性 取决 于 样本 总 体 与 目标 总 体 相似 的 假设 ， 至 少 在 我 们 所 研究 
的 性 质 上 是 相似 的 . 


随机 样本 


本 书 所 讨论 的 统计 方法 通常 假设 样本 是 随机 样本 ， 所 以 介绍 随机 样本 的 有 关 概 
念 是 很 重要 的 . 

我 们 有 两 种 方式 来 定义 随机 样本 ， 第 一 种 定义 是 总 体 元 素 的 个 数 是 有 限 的 N， 这 
里 NN 可 以 很 大 (世界 上 所 有 人 口 数 ) 也 可 以 很 小 (美国 历届 总 统 数 ).， 总体 中 每 个 
元 素 的 重要 性 相同 ， 且 等 可 能 被 抽取 到 . 容量 为 上 (n <N) 的 一 组 样本 可 以 这 样 抽 
取 : 将 总 体 中 所 有 元 素 从 1 到 N 进行 编号 ， 从 中 随机 抽取 nn 个 号 码 ， 使 得 出 现任 意 n 
个 号 码 的 组 合 等 可 能 ， 这 个 号 码 对 应 着 总 体 中 的 个 元 素 . 这 种 抽样 方法 通常 是 无 
放 回 (without replacement) 的 ， 所 有 相同 的 元 素 不 会 在 样本 中 出 现 多 于 一 次 .而 对 
于 有 放 回 (with replacement) 抽样 的 定义 ， 相 同 的 元 素 则 可 能 出 现 两 次 或 两 次 以 上 . 
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定义 2.1.1 从 有 限 总 体 中 任意 抽取 一 组 容量 为 n 的 样本 ， 如 果 每 组 样本 出 现 的 
可 能 性 相等 ， 那 么 称 这 样 得 到 的 样本 为 随机 样本 (random sample). 

上 面 定义 中 的 “随机 ”不 是 针对 样本 本 身 ， 而 是 指 获取 样本 的 抽样 方法 ， 这 一 
点 看 起 来 似乎 有 些 奇怪 . 事实 上 ， 我 们 是 看 抽样 方法 ， 而 不 是 看 样本 本 身 来 判断 一 


组 样本 到 底 是 不 是 随机 样本 . 
假如 一 个 有 限 总 体 共 有 N 个 元 素 ,， 那么 正如 在 1.1 节 所 述 ， 无 放 回 抽样 得 到 的 
N 
容量 为 的 样本 共有 | ”| 种 可 能 ， 有 放 回 抽样 样本 共有 N 种 可 能 . 阁 每 组 样本 出 现 


的 可 能 性 相等 ， 则 认为 这 样 的 抽样 方法 是 随机 的 ， 得 到 的 样本 是 随机 样本 . 

当 总 体 有 限时 ， 前 面 对 随机 样本 的 定义 在 大 多 数 情况 下 是 合适 的 . 但是, 假如 
我 们 要 考察 某 指定 的 人 在 一 个 晚上 做 梦 的 个 数 ， 可 能 会 遇 到 麻烦 .在 这 种 情况 下 ， 
我 们 认为 “随机 样本 ” 指 某 一 晚 做 梦 的 个 数 ， 另 一 晚 做 梦 的 个 数 ， 直 至 比如 说 7 个 
晚上 做 梦 的 个 数 ， 即 使 在 理想 的 情形 下 ， 这 种 抽样 方法 也 不 能 符合 定义 2.1.1 中 的 
“等 可 能 性 ”这 一 概念 的 框架 ， 什 么 叫 等 可 能 性 ? 不 是 针对 个 体 ， 因 为 前 面 我 们 假设 
的 研究 对 象 只 是 个 体 ， 不 是 总 体 的 一 个 代表 (尽管 这 可 能 是 我 们 想 要 研究 的 最 终 目 
标 )， 我 们 为 了 保证 等 可 能 性 ， 难 道 要 在 这 个 人 被 期 望 能 够 活着 的 夜晚 中 ， 选 择 一 些 
夜晚 来 做 研究 吗 ? 显然 , 这 是 不 可 能 的 . 所 以 ， 随 机 样本 至 少 还 需要 一 个 其 他 的 
EX. 

数理 统计 中 随机 样本 的 标准 定义 如 下 所 述 : 

定义 2.1.2 容量 为 nn 的 随机 样本 (random sample of size n) 是 指 一 组 n 个 独立 
同 分 布 的 随机 变量 列 X, Xa, X, 

在 定义 2. 1. 1 中 ， 如 果 抽 样 方 法 是 有 放 回 时 ， 则 定义 2. 1.1 和 定义 2.1.2 是 相同 
的 ， 并 且 当 且 仅 当 在 这 种 情形 下 才 是 独立 的 . 无 放 回 抽样 产生 的 观测 是 非 独立 的 ， 
因为 某 个 个 体 一 旦 被 选中 且 不 放 回 ， 就 意味 着 它 不 可 能 再 被 抽取 到 . 然而 ， 如 果 总 
体 容量 很 大 ， 有 放 回 抽样 和 无 放 回 抽样 在 实际 应 用 中 的 差别 非常 小 ， 所 以 可 以 忽 
略 这 种 观测 间 轻 微 的 不 独立 性 . 本 书 中 的 定理 和 公式 的 推导 都 假设 样本 中 的 观测 是 
独立 的 ， 对 于 有 限 总 体 ， 这 些 定理 在 其 他 假设 下 的 修正 是 存在 的 ， 但 不 在 本 书 的 考 
虑 范围 之 内 ， 这 种 修正 的 效果 只 要 在 样本 量 n 小 于 总 体 容量 10% 的 情况 下 就 可 以 被 
忽略 . 


多 元 随机 变量 


试验 者 可 能 会 测量 或 观测 到 定义 2. 1. 1 中 随机 样本 的 每 个 被 选 元 素 ， 以 及 定义 
2. 1. 2 中 的 每 个 随机 变量 X, 的 几 个 互相 关联 的 特征 ， 在 这 种 情况 下 ， 用 来 描述 几 个 
特征 的 随机 变量 通常 有 两 个 脚 标 ， 比 如 Y;,， 这 里 第 一 个 脚 标 表示 所 选 样本 的 个 体 ， 
第 二 个 脚 标 表示 被 测量 或 观测 的 某 个 特征 . 

也 就 是 说 ，X 实际 表示 的 是 上 维 随机 变量 〈Y ,Ya ,…,Y) ，X; 仍然 是 独立 同 分 
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MAJ, BÆ X, 中 的 每 个 随机 变量 Y, 可 以 是 独立 的 ， 也 可 以 是 非 独立 的 ， 可 以 是 同 分 
布 ， 也 可 以 是 不 同 的 分 布 . 

举 一 个 例子 来 说 ， 考 虑 刚才 讨论 的 “ 梦 ” 的 试验 .随机 变量 X, 表示 第 i 个 观测 
夜晚 做 的 梦 的 个 数 ， 像 定义 1.3. 11 中 定义 的 一 样 ， 假 设 X 是 独立 且 同 分 布 (意思 是 
每 个 X 都 有 相同 的 分 布 函数 ) 有 一 定 的 合理 性 ， 但 是 如 果 试 验 者 每 晚 不 仅 记 录 梦 的 
总 数 ， 还 记录 整个 睡眠 时 间 ， 我 们 分 别 用 Ya, Ya。 表示， 这 样 每 晚 做 梦 的 个 数 和 睡眠 
时 间 可 能 是 相关 的 变量 ， 所 以 Y, , Yo 很 可 能 不 是 独立 的 ， 但 是 ， 每 个 晚上 的 睡觉 模 
式 彼此 是 独立 的 ， 在 数学 上 ， 这 就 意味 着 Yi Y, ,Yi,Ynz 的 联合 概率 分 布 函 数 可 以 分 
解 如 下 : 

iv Vi, Vi, Yj2) = fi(Va, Yiz) fayi Yi2) (1) 
这 里 有 和 所 DIE (Ya, Ya) A (Yn Ya) 的 联合 概率 函数 .假如 连续 两 晚 睡觉 模 
式 的 联合 概率 分 布 不 变 ， 即 有 和 6 一样， 那么 我 们 可 以 说 (Y, ,Y,) 和 (YY,Yp) 
有 相同 的 分 布 ， 为 了 更 方便 地 表达 这 种 关系 ， 即 随机 向 量 之 间 要 求 独 立 同 分 布 ， 而 
随机 向 量 内 部 的 随机 变量 不 必 独 立 同 分 布 ， 我 们 可 以 用 Yi ,Ya 的 联合 来 表示 X, X 
时 称 X 为 二 维 随机 变量 .成 的 值 实际 上 包括 两 个 值 ， 一 个 是 Y 的 值 ， 一 个 是 Ye 的 
值 ， 这 样 ， 前 面 所 述 的 可 以 概括 为 “随机 变量 (X| 是 独立 同 分 布 的 ” 

类 似 地 ， 我 们 还 可 以 考虑 每 晚 有 大 个 测量 ， 它 们 是 Yas Yast Yas H X, 来 表示 
这 上 个 随机 变量 ,那么 称 X, 为 上 维 随机 变量 (k-variate random variable) ， 或 是 多 维 随 
机 变量 (multivariate random variable). 从 定义 1.3.11 的 角度 来 讲 ，X, 是 独立 的 就 意 
味 着 所 有 [X| 的 联合 概率 分 布 可 以 分 解 成 n 个 联合 概率 旺 数 的 乘积 ， 并且 每 个 都 
E Y, ,Ya ，…Y 的 联合 概率 函数 ， 同 样 地 ，X 同 分 布 是 指 上 面 提 到 的 联合 概率 函数 
是 相同 的 函数 . 

现在 我 们 有 两 种 随机 样本 的 定义 ， 第 一 种 定义 仅仅 适用 于 有 限 总 体 样本 并 
且 直 接 与 样本 空间 联系 在 一 起 ， 如 果 每 一 种 可 能 的 样本 (容量 为 上) 表示 成 样 
本 空间 中 的 一 点 ， 且 样本 空间 中 每 个 点 被 选 为 样本 的 概率 相等 ,那么 这 种 抽样 
方法 是 随机 的 ， 且 抽 得 的 样本 是 随机 样本 .上面 的 定义 中 ， 我 们 仅 用 到 样本 空 
间 以 及 概率 函数 的 概念 ， 但 是 并 没有 明确 或 含 营地 提 及 随机 变量 这 一 概念 . 

例 2. 1.1 
一 个 心理 学 家 希望 选取 4 名 研究 对 象 来 进行 个 体 训练 和 考试 .他 登 出 广告 ， 有 20 个 
志愿 者 应 聘 ， 他 有 几 个 方法 从 容量 为 20 的 样本 总 体 中 抽取 一 容量 为 4 的 样本 . 

他 可 能 会 选择 最 先 来 应 聘 的 4 名 志愿 者 ， 他 的 选择 会 偏向 于 那些 积极 主动 的 志 
愿 者 ， 这 可 能 就 不 是 随机 样本 . 

20 
4 


他 可 能 严格 按照 定义 2. L. 1 来 考虑 ， 选 择 容量 为 4 的 样本 ， 有 |[ )=4845 种 可 


[23] 
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能 ， 那 么 他 可 以 用 4845 张 同样 的 纸 ， 每 张 纸 上 写 4 个 名 字 ， 每 次 都 是 一 个 不 同 的 组 
合 ， 然 后 把 它们 放 到 篮子 里 ， 随 机 地 抽取 一 张 纸 片 ， 纸 片上 的 4 个 人 则 被 选中 .这 
样 得 到 的 是 随机 样本 ,但 这 种 抽样 方法 是 不 现实 的 . 

另外 一 种 获取 随机 样本 的 方法 是 ， 把 20 个 名 字 各 写 在 20 张 纸 上 ， 然 后 以 某 种 
随机 方式 一 个 接 一 个 地 抽取 4 张 纸 ， 比 如 可 以 从 装 满 这 些 纸 的 一 个 帽子 中 抽取 .， 这 
种 抽样 方法 同样 满足 随机 样本 的 定义 ， 这 个 过 程 可 以 通过 计算 机 编程 来 模拟 . m 

随机 样本 的 第 二 个 定义 直接 与 随机 变量 相关 ， 而 不 涉及 样本 空间 . 但 是 ， 由 
于 随机 变量 是 定义 在 一 个 样本 空间 上 的 函数 ， 尽 管 我 们 没有 直接 引进 样本 空间 这 
一 概念 ， 但 是 它 隐 含 在 实际 背景 中 ， 同 样 ， 正 如 1.3 节 所 提 到 的 ， 随 机 变量 所 有 
可 能 取 值 的 全 体 构成 了 样本 空间 ， 有 时 ， 为 了 解决 出 现 的 统计 问题 ， 将 近似 样本 
空间 的 点 列举 出 来 是 必要 的 . 实际 上 ， 如 果 所 有 可 能 的 测量 结果 (随机 变量 假设 
的 值 ) 都 是 样本 空间 中 的 点 ， 那 么 就 不 会 产生 什么 混淆 我们 通常 认为 这 些 测 量 
结果 是 数值 ， 但 是 有 时 测量 的 数值 很 难 清楚 地 表达 出 来 . 所 以 ， 我 们 最 好 讨论 各 
种 不 同类 型 的 测量 . 

度量 尺度 

度量 的 类 型 通常 被 称 为 度量 尺度 (measurement scale) ， 各 种 不 同 的 出 版 物 都 详 
尽 地 讨论 过 ， 其 中 包括 Stevens( 1946) 的 一 篇 优秀 论文 . 我们 将 从 “最 弱 ” 的 度量 下 
度 ， 即 名 义 尺度 开始 ， 通 过 讨论 次 序 尺度 和 区 间 尺 度 ， 最 后 到 “最 强 ” 的 刻度 ， 即 
比率 尺度 . 

名 义 尺 度 

度量 的 名 义 尺度 (nominal scale) 只 是 使 用 数字 将 性 质 或 元 素 分 成 不 同 种 类 或 范 
畴 的 一 种 方法 .分配 到 观测 上 的 数字 只 是 用 作 “ 名 字 ” 以 便 说 明 观 测 所 在 的 种 类 或 
范畴 ， 因 此 叫做 “名 义 尺 度 "， 对 掷 硬币 我 们 定义 随机 变量 为 : 硬币 正面 朝 上 时 , € 
为 1， 反面 朝 上 时 ， 它 为 0， 这 时 使 用 了 度量 的 名 义 尺度 . 我们 也 可 以 适当 地 选择 
7.3 和 3.9 来 分 别 表示 正面 和 反面 ， 我 们 选择 0 和 1 主要 是 因为 方便 计算 所 掷 硬币 中 
正面 朝 上 的 总 次 数 ， 当 把 12 个 研究 对 象 用 1 到 12 个 数字 任意 标号 时 ， 这 时 使 用 了 度 
量 的 名 义 尺度 ， 号 码 的 分 配 则 是 随机 变量 的 一 种 形式 ， 当 根据 颜色 将 研究 对 象 分 类 
时 ， 种 类 可 以 用 1,2,3 或 蓝 、 黄 、 红 或 4、B8、C 来 标记 . 这些 号 码 只 是 类 别 的 名 字 ， 
当然 只 要 种 类 保持 不 变 ， 也 可 以 用 其 他 未 使 用 过 的 号 码 来 代替 . 

次 序 尺度 

度量 的 次 序 尺度 (ordinal scale) 用 于 存在 诸如 “更 小 ”,“ 更 大 " ,“ 相 等 ”这 些 
比较 关系 的 度量 中 .度量 的 这 些 具体 数字 只 是 用 来 从 小 到 大 有 序 地 排列 元 素 的 一 种 
工具 ， 由 于 它 能 够 根据 度量 的 相应 大 小 对 元 素 进行 排序 ， 所 以 称 为 次 序 尺度 .如果 
其 中 一 些 元 素 彼 此 相等 ， 我 们 称 为 结 ， 当 一 个 人 用 数字 1 来 表示 3 个 品牌 中 最 喜欢 的 
一 个 ,3 表示 最 不 喜欢 的 一 个 ，2 表示 剩 下 的 那个 品牌 ， 这 时 ， 她 就 是 在 使 用 度量 的 
次 序 尺度 ， 数 字 只 是 作为 表达 她 喜欢 程度 的 一 种 方便 方式 当然， 她 可 以 用 任意 三 
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个 数字 如 16 ,20 ,75 来 代替 1,2,3 ,只 要 这 些 数字 的 相关 顺序 能 够 表达 出 她 相应 的 喜欢 
程度 就 行 . 

区 间 尺 度 

第 3 种 尺度 是 度量 的 区 间 尺 度 (interval scale) ， 在 一 般 的 度量 中 ， 不 仅 考 虑 度量 
的 次 序 尺度 ， 还 会 考虑 到 两 个 度量 区 间 的 大 小 来 作为 相关 信息 ， 即 两 个 度量 间 差 别 
(从 减法 的 意义 上 来 讲 ) 的 大 小 .区间 尺度 涉及 一 种 单位 长 度 的 概念 ， 任 意 两 个 度量 
间 的 距离 可 以 用 一 些 单位 长 度 的 倍数 来 表达 ， 用 来 理解 区 间 尺 度 这 一 概念 最 好 的 例 
子 就 是 我 们 日 常生 活 中 的 温度 的 表示 法 .温度 增加 一 个 单位 〈 度 ) 定义 为 温度 计 中 
一 定 体积 水 银 柱 的 变化 量 ， 因 此 任意 两 个 温度 的 差别 可 以 用 这 个 单位 ， 或 度 来 衡量 . 
温度 的 实际 数值 只 是 和 一 个 任 选 为 “零度 ”点 的 比较 ， 测 量 的 区 间 尺 度 需 要 一 个 零 
点 和 一 长 度 单位 (只 有 后 者 没有 前 者 是 不 行 的 ) ， 但 是 哪 点 定义 为 零点 ， 哪 种 长 度 定 
义 为 单位 长 度 并 不 重要 ,温度 可 以 同时 由 华氏 温标 和 摄氏 温标 来 计量 ， 它 们 有 不 同 
的 零度 和 不 同 定义 的 1 度 或 单位 . 区 间 度 量 的 法 则 不 会 因 刻 度 或 位 置 或 两 者 同时 的 
改变 而 受 干扰 . 

比率 尺度 

最 后 ， 不 仅 当 次 序 和 区 间 的 大 小 很 重要 ， 而 且 两 度量 的 比率 也 很 有 意义 时 ， 我 
们 需要 引入 度量 的 比率 尺度 (ratio scale)， 如 果 说 一 个 量 是 另 一 个 量 的 “2 倍 ” 是 合 
理 的 话 ， 引 入 度量 的 比率 尺度 就 是 合适 的 ， 如 度量 农作物 产量 ， 距 离 ， 重量， 高 度 ， 
收入 等 .实际 上 ， 比 率 尺 度 和 区 间 尺 度 的 唯一 差别 是 前 者 要 求 有 绝对 零点 ， 而 后 者 
的 零点 可 以 是 任意 一 点 ， 和 区 间 尺 度 一 样 ， 比 率 尺 度 的 单位 长 度 也 是 可 以 任意 定 
义 的 . 

我 们 不 可 能 就 度量 本 身 来 谈 哪 种 度量 尺度 是 合适 的 ， 而 应 该 考虑 被 度量 的 量 以 
及 度量 方法 ， 然 后 再 决定 赋予 度量 数值 的 涵义 . 

关于 这 4 种 度量 尺度 ， 科 学 家 们 没有 达成 一 致 的 意见 ， 有 些 科 学 家 部 欢 用 其 他 
尺度 ， 而 有 些 度量 也 不 能 清楚 地 归 类 于 上 面 4 种 尺度 的 任何 一 种 .这样 看 来 ， 上 面 
的 分 类 显得 把 问题 过 于 简单 化 ， 但 针对 本 书目 的 而 言 已 经 足够 了 . 

大 多 数 常用 参数 统计 方法 要 求 度量 是 区 间 尺 度 (或 者 比 这 更 强 的 尺度 ) ， 而 大 
多 数 非 参 数 统计 方法 通常 假设 名 义 尺 度 和 次 序 尺度 是 合适 的 ， 当然， 每 种 度量 扩 
度 应 有 弱 度 量 尺 度 的 所 有 性质. 因此 ， 只 需要 弱 度 量 的 统计 方法 可 能 也 会 用 强 
EH. 


统计 量 


到 目前 为 止 ， 我 们 已 经 讨论 了 总 体 ， 来 自 总 体 的 样本 ， 以 及 度量 样本 所 感 兴趣 
的 性 质 的 度量 尺度 ， 度 量 尺度 涉及 随机 变量 ， 因 为 度量 样本 元 素 的 体系 实际 上 就 是 
一 个 随机 变量 .由 于 统计 量 是 随机 变量 ， 因 此 ， 度 量 尺度 与 统计 量 有 关 ， 对 于 数理 
统计 学 家 来 说 ,“ 统 计量 ”和 “随机 变量 ”这 两 个 术语 是 可 以 互 换 的 . 但是， 统计 量 
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一 词 的 普遍 使 用 表明 它 不 仅仅 是 一 个 随机 变量 . 
统计 量 一 词 本 来 是 指 国 家 公布 的 由 政府 收集 的 数据 总 括 的 结果 ， 因 此 有 人 认为 
统计 量 就 是 基于 一 些 数 的 一 个 数 ， 比 如 样本 均值 ， 总 体 中 某 一 类 元 素 占 整个 总 体 的 
比例 等 等 ， 从 这 个 意义 上 讲 ， 统 计量 就 是 一 个 数 ， 但 是 ， 如 果 我 们 考虑 不 同样 本 均 
值 具体 数值 存在 不 同 ， 或 是 不 同时 间 总 体 富有 变化 ， 我 们 就 能 够 将 统计 量 的 概念 从 
仅仅 一 个 数 扩展 到 得 到 这 个 数 的 法 则 ， 这 时 ,“ 样 本 均值 ”就 是 统计 量 . 一 个 样本 中 
实际 得 到 的 平均 值 就 是 统计 量 的 一 个 值 ， 作 为 法 则 ， 统 计量 需要 满足 作为 一 个 随机 
变量 ,样本 空间 (合理 定义 的 样本 空间 ) 中 点 的 函数 的 要 求 . 统计 量 还 要 体现 数据 
总 括 这 一 想法 ， 因 此 通常 所 考虑 的 统计 量 是 几 个 随机 变量 函数 的 随机 变量 ， 统 计量 
的 值 是 这 几 个 随机 变量 值 经 过 算术 运算 所 得 的 结果 . 由 于 随机 变量 是 定义 在 样本 空 
间 的 函数 ， 那 么 统计 量 则 是 定义 在 一 个 特殊 样本 空间 上 的 函数 ， 这 个 样本 空间 中 的 
样本 点 是 n 维 随机 向 量 的 所 有 可 能 值 ， 下 面 统 计量 的 正式 定义 和 例子 将 进一步 阐明 
这 个 概念 . 
定义 2. 1.3 一 个 统计 量 (statistic) 是 将 样本 空间 中 的 样本 点 映射 到 实数 上 的 
函数 ， 其 中 样本 空间 中 的 样本 点 是 一 些 多 元 随机 变量 的 所 有 可 能 值 ， 换 句 话 说 ， 统 


计量 就 是 几 个 随机 变量 的 函数 . 
作为 统计 量 的 定义 ， 定 义 2.1.3 中 的 每 一 句 话 都 是 充分 的 ， 它 们 清楚 地 阐述 了 这 
个 概念 . 
例 2.1.2 
用 和 ,X,,…,X, 表示 n 个 学 生 的 考试 分 数 ， 每 个 X, 都 是 随机 变量 令 W 等 于 考试 分 
数 的 平均 值 ， 
wa Ly Q 


i=1 
MJ W E — ET. 3 X, =76,X, =84,X, = 85 表示 3 个 学 生 的 考试 分 数 ，W = 
(L) (76 +84+85) =81 Z. Hitit W WE X 2. 1.3 中 的 第 二 名 话 ; 它 是 随机 变 


B X, ,X,,…,X, 的 函数 .由 于 W 将 随机 向 量 (X,,X,,…,X,) 映射 到 实数 ， 这 满足 
定义 2.1.3 中 的 第 一 句 话 ， 这 时 ， 若 多 元 随机 向 量 (X,X,X) 的 值 为 (76,84， 


85) ， 那 么 统计 量 W 的 值 为 81 š. 统计 学 中 经 常 应 用 这 一 特殊 的 统计 量 ， 称 为 “ 样 


本 均值 "， 下 一 节 中 将 进一步 讨论 它 . m 
次 序 统 计量 
我 们 经 常会 使 用 称 为 次 序 统计 量 (order statistic) 的 一 类 特殊 的 统计 量 ， 特别 当 
我 们 要 处 理 有 序 测量 数据 的 时 候 .假如 一 随机 变量 〈X,,X,,…,X,) 的 观测 值 (x, 
X, x) 是 “有 序 的 "， 即 它 的 元 素 是 按 从 小 到 大 的 顺序 排列 的 ， 我 们 用 x” < 
xY) 过 <x9 来 表示 有 序 观测 (order observation). 
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定义 2.1.4 把 (X,,X,,…,X,) 的 每 个 观测 值 (2 ,x,,…,x,) 按 从 小 到 大 排 
列 ， 取 值 为 第 个 值 x*“ 的 随机 变量 成 为 秩 为 上 的 次 序 统计 量 (order statistic of rand 
k) X”. 

因此 ， 秩 为 1 的 次 序 统 计量 X 总 是 取 (x,,x,," x.) 中 最 小 值 ， 在 例 2. 1.2 
B, X =76,X? =84,XG =85. 若 (X,,X,,X,) 的 另 一 观测 取 值 (93 ,73,81) ， 那 
么 次 序 统计 量 为 X” =73,X ”=81,X =93. # (X,X,X, ) 是 一 随机 样本 ， 则 
有 时 X < X 三 … 和 Xe” 称 为 次 序 随 机 样本 《ordered random sample). 

我 们 将 会 在 2. 2 节 中 介绍 很 多 其 他 有 用 的 统计 量 ， 并 进一步 讨论 这 些 统 计量 在 
分 析 试 验 结果 中 的 作用 . 


习题 


1. 美国 国会 委员 会 希望 检验 关于 美国 高 中 立法 的 作用 ， 从 华盛顿 地 区 随机 选取 5 所 中 学 来 
进行 研究 . 
(a) 目标 总 体 是 什么 ? 
(b) 样本 总 体 是 什么 ? 
(c) 如 果 华盛顿 地 区 有 100 所 高 中 ， 那么 共有 多 少 个 不 同 的 样本 ? 
(d) 在 问题 中 每 个 样本 出 现 的 概率 各 是 多 少 ? 
2. 托 皮卡 一 家 电视 台 向 观众 提出 这 样 一 个 问题 :“ 在 堪萨斯 州 可 否 人 允许 饮酒 ?”372 个 电话 回 
访 中 有 164 人 说 “不 可 ”， 其 余 的 人 为 “可 以 ”. 
(a) 目标 总 体 是 什么 ? 
(b) 样本 总 体 是 什么 ? 
(c) 样本 是 随机 样本 吗 ? 请 说 明 原 因 . 
(d) 题目 中 隐 含 了 3 个 统计 量 ， 它 们 分 别 是 什么 ， 观 测 值 取 多 少 ? 
(e) 统计 投票 数 时 采用 了 哪 种 度量 尺度 ? 
(f) 记录 电话 回访 的 答案 为 “不 可 ”或 “可 ”时 采用 了 哪 种 度量 尺度 ? 区 x 
3. 田径 运动 会 授予 在 比赛 中 积分 最 高 的 运动 队 奖 品 ， 队 中 的 运动 员 在 比赛 中 每 次 获得 第 一 、 
第 二 、 第 三 名 的 积分 值 分 别 为 5,3 ,1. 
(a) 记录 积分 采用 了 哪 种 度量 尺度 ? 
(b) 题目 中 提 到 的 〈 隐 含 ) 统计 量 是 什么 ， 有 何 作 用 ? 
4. ”足球 队员 队 服 上 印 有 不 同 的 号 码 ， 这 些 号 码 采 用 的 是 哪 种 度量 尺度 ? 
5 


下 面 采 用 的 是 哪 种 度量 尺度 ? 
(a) 邮政 编码 (b) 本 地 电话 号 码 
(c) 电话 区 号 (d) 社会 保险 号 码 
6 ”下面 采用 的 是 哪 种 度量 尺度 ? 
(a) 月 工资 (b) 汽油 泵 上 被 度量 的 加 仑 数 
(c) 每 磅 别 啡 的 价格 (d) IQ 分 数 表示 的 智商 


7. 为 了 随机 选取 一 律师 事务 所 ， 从 这 个 城市 中 所 有 律师 的 名 单 中 随机 抽取 一 个 ， 则 这 个 律 
师 所 在 的 律师 事务 所 则 被 选中 ， 问 这 个 律师 事务 所 的 选取 是 随机 的 吗 ? 


[78] 
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8. 我 们 采用 下 面 的 方法 来 估计 观看 各 种 电视 节目 观众 的 数量 : 2200 个 家 庭 作 为 随机 样本 进 
人 调查 ， 这 些 家 庭 同意 将 他 们 的 电视 机 和 一 电子 设备 连接 ， 以 便 能 追踪 他 们 所 观看 不 少 
于 8 分 钟 的 节目 . 
(a) 目标 总 体 是 什么 ? (b) 样本 总 体 是 什么 ? 
(c) 评述 结论 的 精确 度 . 


思考 题 


l. 一 个 试验 的 研究 对 象 是 掷 n 次 不 均匀 型 角子 ， 令 X, 表示 第 莽 次 投掷 的 仙 子 点 数 ， 那 么 各 ， 
X, se ,X, 组 成 的 是 一 组 随机 样本 吗 ? 

2. 从 整数 1 到 7 中 无 放 回 地 抽取 容量 为 4 的 一 组 随机 样本 ， 
(a) 可 能 样本 的 总 数 共 有 多 少 ? 
(b) 每 个 样本 的 概率 是 多 少 ? 
(c) 样本 中 至 少 有 一 个 奇数 的 概率 是 多 少 ? 
(d) 样本 中 数 的 总 和 为 12 的 概率 是 多 少 ? 

3. 从 整数 1 #J N 中 无 放 回 地 抽取 容量 为 n 的 一 组 随机 样本 ,样本 中 至 少 有 一 个 奇数 的 概率 
是 多 少 ? 


2:2 jh IF 


统计 量 的 一 个 基本 目的 是 估计 总 体 的 未 知性 质 ， 这 些 估计 出 的 未 知性 质 通 常 是 
用 数字 表示 的 ， 并 且 包 括 可 列举 的 一 些 项 目 ， 例 如 未 知 比率 、 均 值 、 概 率 等 等 ， 事 
实 上 ， 估 计 是 基于 样本 〈 如 果 有 概率 描述 ， 则 是 随机 样本 ) 的 ， 并 且 估 计 是 关于 随 
机 变量 分 布 未 知性 质 的 有 根据 推测 ， 这 里 随机 变量 表示 对 总 体 研 究 感 兴趣 的 量 . 例 
如 ， 我 们 可 以 用 晶体 管 产 品 中 样本 的 不 合格 率 来 估计 总 体 的 不 合格 率 ， 用 来 作 估 计 
的 统计 量 自然 叫做 估计 量 (estimator). 本 节 我 们 将 要 讨论 一 些 估 计量 ， 例 如 样本 均 
值 (sample mean) ， 样 本 方差 (sample variance) 和 样本 分 位 数 (sample quantiles). FÈ 
们 首先 引入 一 个 与 众 不 同 的 知 计量， 经 验 分 布 函数 (empirical distribution function). 


经 验 分 布 函数 


一 个 随机 变量 的 真实 分 布 函数 一 般 是 未 知 的 ， 有 时 ， 我 们 只 能 够 推测 分 布 函数 
的 形式 ， 或 将 推测 作为 真实 分 布 函数 的 一 个 近似 .根据 样本 的 观测 值 构 作 S(x) 图， 
以 此 来 作为 整个 未 知 分 布 函数 F(x) 的 估计 ， 这 是 推测 分 布 函 数 的 一 种 好 方法 ， 介 绍 
作 图 方法 最 好 用 举例 子 来 解释 ， 由 此 我 们 给 出 定义 : 

定义 2.2.1 设 X, 矶 ,…, 和 是 一 组 随机 样本 ， 经 验 分 布 函 数 S(x) (简称 为 
e.d.f) 是 x 的 函数 ， 它 在 x 点 的 取 值 为 小 于 或 等 于 x 的 X, 在 样本 总 数 中 所 占 的 比 


例 ，- oo<x<oo. 
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例 2.2.1 

在 一 项 体能 研究 中 ， 从 某 一 高 中 随机 抽取 了 5 名 男生 ， 记 录 他 们 跑 完 1 英里 的 时 间 . 

时 间 (转化 成 分 钟 后 ) 分 别 为 6. 23 ,5. 58 ,7. 06 ,6. 42,5. 20， 把 它们 标记 在 图 2-1 横 
轴 上 ， 由 于 经 验 分 布 范 数 S(x) 是 小 于 或 等 于 x BJ X, 在 样本 总 数 中 所 占 的 比例 ， 根 

据 这 组 特定 样本 ， 把 它 画 在 图 2-1 rh. 


Sto) 


1 
5 | | 
— X -.— — ñ. V 


5.20 5.58 6.23 6.42 7.06 
图 2-1 经 验 分 布 函数 | mi 

从 例 2. 2. 1 PALA, 2R mAAR AENA, BETA SS E El n, 3Ë 
且 只 在 样本 取 值 处 有 变化 . 图 2-1 中 竖 线 并 不 是 经 验 分 布 范 数 的 一 部 分 ， 只 是 一 方 
面 为 了 外 观 ， 另 一 方面 在 后 来 确定 样本 分 位 数 时 比较 方便 ， 我 们 从 左 到 右 来 考虑 
经 验 分 布 函数 的 图 像 ， 注 意 到 S( x) 在 样本 最 小 值 前 均 取 值 为 零 ， 在 每 个 样本 取 值 
处 会 增加 一 阶 的 跃 度 ， 每 个 路 度 是 1/n， 在 样本 最 大 值 处 S(x) 取 最 大 值 1.0， 并 且 
在 剩 下 所 有 比 样本 最 大 值 大 的 x 处 都 取 1.0. S(x) 很 像 非 降 、 取 值 从 0 到 1 的 分 布 
函数 .但 5S(x) 只 是 由 经 验 (来 自 样 本 ) 确定 的 ， 并 由 此 而 得 名 . | 

图 2-1 只 描述 了 5S(x) 的 一 组 观测 值 ， 其 他 的 样本 值 将 产生 另外 不 同 的 S(x) 的 图 
像 ， 这 表明 了 5S(x) 的 随机 性 ， 从 这 个 意义 上 讲 ， 它 是 一 个 随机 变量 . 但是， 由 于 它 
是 一 个 函数 ， 且 观测 值 是 整个 图 像 而 不 是 单个 值 ， 所 以 称 SCx) 为 随机 函数 (random 
function) 更 加 合适 ， 因 为 它 能 够 相当 好 地 估计 随机 变量 的 分 布 函 数 ， 所 以 它 通常 用 
做 一 个 估计 量 ， 为 了 区 分 经 验 (或 样本 ) 分 布 函数 ， 我 们 称 随机 变量 的 分 布 函数 为 
总 体 分 布 函数 . 

从 某 种 意义 上 讲 ， 经 验 分 布 函数 的 观测 值 可 以 认为 是 总 体 分 布 函 数 的 取 值 ， 
准确 些 讲 ， 基 于 样本 观测 值 x. ,x,,…,x,,S(x) 的 一 个 观测 值 和 一 个 取 x x, x, 
中 每 个 值 概率 都 是 1/n 的 随机 变量 的 分 布 是 一 样 的 这 种 随机 变量 的 分 布 咀 数 是 
一 个 阶梯 函数 ， 且 在 每 个 数值 x ,x,,…,x, 处 的 跃 度 为 1/n， 利 用 第 1 章 中 的 定义 ， 
我 们 容易 得 到 随机 变量 的 均值 ， 方 差 和 分 位 数 . 
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例 2. 2. 2 
随机 变量 X 的 分 布 函数 与 例 2. 2. 1 中 8S(x) 相 同 ， 它 有 如 下 概率 分 布 ; 

P(X =5.20)=0.2 P(X=5.58) = 0.2 

P(X = 6.23) = 0.2 P(X = 6.42) = 0.2 

P(X = 7.06) = 0.2 
X 的 分 布 函数 的 图 像 与 图 2-1 相同 ， 由 定义 1.4.1 Hl, X 的 中 位 数 是 6.23， 由 定义 
1.4.3 3, X 的 均值 为 

E(X) = 之 xf(x) 


=(5.20)(0.2) + (5.58)(0.2) + (6.23)(0.2) + (6.42)(0.2) + (7.06)(0.2) 
= 6.098 | (1) 

同样 ， 由 定义 1.4.4， 可 计算 成 的 方差 为 
Var (X) = E(x = FO0Yf09 


= 0.424 Bs 


估计 量 


为 了 区 分 真实 “总 体 ” 的 均值 ， 方差 和 分 位 数 ， 由 样本 计算 得 到 的 均值 ， 方 差 
和 分 位 数 (如 在 例 2. 2. 2 h) 分 别称 为 样本 均值 ,样本 方差 ， 样 本 分 位 数 ， 正 如 经 验 
分 布 函数 可 以 作为 总 体 分 布 函 数 的 估计 量 ， 样 本 均值 ,方差 ， 分 位 数 也 可 以 分 别 作 
为 总 体 均值 ， 方 差 ， 分 位 数 的 估计 量 . 

定义 2.2.2 X,X,X, 是 一 组 随机 样本 ,样本 p 分 位 数 Q, 满足 以 下 两 个 条 件 : 

1. 小 于 0, 的 X, 的 比例 <p. 

2. K+ Q, BJ X, ñj Lp] < 1 - p. 

正如 总 体 分 位 数 从 总 体 分 布 函数 得 到 的 方式 一 样 ， 每 个 样本 分 位 数 都 可 以 
由 经 验 分 布 函 数 得 到 .样本 己 分 位 数 是 S(x) =p 处 的 x 值 ， 如 果 不 止 有 一 个 x 值 
HES) =p， 我 们 取 最 大 值 与 最 小 值 的 均值 作为 该 样本 p 分 位 数 ， 与 总 体 分 位 
数 的 处 理 一 样 .样本 p 分 位 数 Q. 取决 于 随机 变量 的 取 值 ， 因 此 它 是 一 个 统计 
E. 注意 ， 为 简便 起 见 ， 我 们 只 针对 随机 样本 定义 样本 分 位 数 . 

一 种 直接 由 样本 而 不 通过 S(x) 的 图 像 而 得 到 样本 p 分 位 数 的 方法 是 ， 用 p 乘 以 样 
本 容量 n， 四 舍 五 人 得 到 一 相 邻 的 较 大 整数 ， 以 该 整数 为 秩 的 次 序 统计 量 的 观测 值 就 是 
样本 p 分 位 数 ， 如 果 (p `n) 是 一 整数 ， 那 么 样本 分 位 数 是 以 (p* n),(p* n+1) 为 秩 
的 两 个 次 序 统计 量 的 平均 值 . 
例 2.2.3 
从 市 区 妇女 俱乐部 中 的 已 婚 妇 女 中 随机 抽取 6 名 妇女 ， 记 录 每 位 妇女 的 孩子 个 
数 ， 分 别 为 0,2,1,2,3,4, 经 验 分 布 函数 如 图 2-2 Br R. 样本 中 位 数 Q. ;是 2， 
样本 分 位 数 Cu ,CQ, ;分 别 为 1 和 3. 按照 我 们 的 约定 ，1/3 样本 分 位 数 Ca 是 1 
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和 2 的 平均 值 ， 即 1.5. 这 些 数 可 以 用 来 估计 未 知 的 总 体 分 位 数 . 


Slx} 


图 2-2 经验 分 布 函数 El 
注意 , 在 (1) 和 (2) 式 中 , f(x) =1/n， 可 以 把 这 一 因子 提 到 和 号 外 ， 这 样 样本 


均值 和 方差 计算 起 来 比例 2.2.2 简单 ， 由 这 种 简便 的 计算 方法 ， 我们 给 出 下 面 的 定义 . 
定义 2. 2.3 RX, X, e, X, 是 一 组 随机 样本 ， 则 样本 均值 XX 定义 如 下 ， 
x = 1 ° x, (3) 
"n i=1 
样本 方差 $ 定义 如 下 ， 
5S2= 工 > (x — X? (4) 
H i=] 
同时 ， 它 还 等 价 于 下 式 
5S2= 工 》 xt X2 (5) 
n i=1 
样本 标准 差 (sample standard deviation) S 是 样本 方差 的 平方 根 . 
例 2. 2. 4 
例 2. 2. 3 中 随机 样本 0,2,1,2,3,4 的 样本 均值 是 
X={0+2+1+2+3+4) 
= 2 (6) 
样本 方差 是 
S2=1⁄(22 + 0 + 12 + 0 + 12 + 22) 
= 1š (7) 
因此 ， 未 知 均值 的 估计 是 2， 未 知 方差 的 估计 是 13， m 


可 能 除了 经 验 分 布 函数 外 ， 上 面 所 介绍 的 估计 量 提 供 了 未 知 总 体 参 数 的 点 估计 
( point estimate)， 即 ， 前 面 的 例子 中 我 们 得 到 了 未 知 均值 的 估计 , “均值 的 估计 值 为 
2"”， 单 点 “2” 是 估计 . 

我 们 经 常 更 喜欢 ， 同 时 也 更 谨慎 地 说 :“ 我 们 以 95% 的 置信 水 平 认为 未 知 均值 落 
在 1.3 与 2.7 之 间 .” 这 种 估计 称 为 区 间 估 计 (interval estimate). 区 间 估 计量 由 两 个 
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统计 量 组 成 ， 它 们 是 区 间 的 两 个 端点 ， 置 信 系 数 (confidence coeffcient) 是 区 间 估 计 
量 包含 未 知 总 体 参 数 的 概率 ， 前 面 的 叙述 中 置信 系数 是 0.95. 区 间 和 置信 系数 一 起 
称 为 未 知 量 的 置信 区 间 . 

点 估计 是 比较 容易 的 ， 因 为 作 点 估计 只 需要 考虑 一 个 数 ， 任 意 一 个 数 . 但 是 ， 
有 些 点 估计 量 比 其 余 的 估计 量 要 好 .为 了 比较 哪 种 估计 量 更 好 ， 其 点 估计 的 比较 标 
准 几乎 在 任何 一 本 概率 统计 导论 的 书 中 都 可 以 找到 . 

一 个 好 估计 量 的 标准 之 一 是 无 偏 性 (unbiased). 在 下 面 的 讨论 中 ， 我 们 通常 用 
希腊 字母 9,y,o 或 p 表示 参数 ，6 表示 用 来 估计 9 的 统计 量 . 

定义 2. 2.4 ”如 果 E(6) =9， 则 称 统计 量 6 是 总 体 参 数 0 的 无 偏 估计 (unbiased 
estimator ) . 

下 面 的 定理 表明 头 是 总 体 均 值 的 无 僻 佑 计 . 

定理 2. 2. 1 XX,,X,,…,X, 是 一 组 来 自 均值 为 ,方差 是 o 总体 的 独立 随机 变 
E, 那么 


E(X)= x (8) 
并 且 
Var (X) = o2/n (9) 
证 明 由 定理 1.4.1， 
E(X + X, +++ + Xn) = E(Xi) + E(X;) + -+ + E(X,) = nz (10) 
所 以 
EX)=E [1Xyx])=1Xr00= dn =u (11) 
这 表明 忒 是 总 体 均值 的 无 偏 估计， 同时 ， 由 定理 1.4.3 
Var [> x) = Y Var (Xi) = no’ (12) 
那么 ， 经 过 简单 的 代数 运算 ， 可 以 得 到 下 式 
Var (X) = Var ( > x) = = Var (5 x) = L no? = o2/n (13) 
即 完成 了 定理 的 证 明 . 
标准 误差 


一 个 估计 量 的 标准 差 通常 称 为 标准 误差 (standard error) ， 所 以 它 不 会 和 总 体 标 
准 差 的 概念 混淆 ， 因 为 这 是 一 个 完全 不 同 的 概念 . 如 定理 2.2.1 所 示 ，X 的 标准 误差 
是 o/ /n. 

无 偏 估 计量 s? 

我 们 已 经 看 到 8 不 是 o° 的 无 偏 估计 ， 因 此 ， 习 惯 上 我 们 使 用 无 偏 估 计 s 


FR Ë — Xy 14 
s = 2 (X X) (14) 
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作为 o 的 估计 量 . 但 是 ，S #ls 都 是 总 体 标准 差 o 的 有 偏 估计 . 

渐 近 置信 区 间 

由 定理 2. 2. 1 及 中 心 极限 定理 (€M 1.5.2), WE X,X,X, 是 一 组 均值 为 
u, HAE o? 的 独立 随机 变量 ， 那么 ， 当 n 趋 于 无 穷 时 ， | 


> Xi 一 nu _ X- L 
Vno? oa/Vn ia. 
的 分 布 项 数 趋 于 标准 正 态 分 布 . ELMAR, WE n 足够 大 ， 
P (z-a < 2 < 21-02) (16) 


的 概率 近似 是 1 -a， 其 中 z -> 表示 标准 正 态 随 机 变量 的 (1-0/2) 分 位 数 . 
上 面 的 不 等 式 经 过 代数 整理 ， 可 写 为 


p (Ra F< p<Rtao Se) 1 = z (17) 


当 n 很 大 时 ， 上 式 给 出 了 的 近似 置信 区 间 .， 进一步 讲 ， 既 然 o 很 少 已 知 ， 那么 通 
常情 况 下 ， 当 nn 足够 大 ， 对 于 来 自 有 非 零 方差 有 限 总 体 的 随机 样本 ， 由 中 心 极 限定 
理 我 们 可 以 用 s 来 估计 oo， 从 而 得 到 jy 的 近似 置信 人 区 间 . 对 大 多 数 的 实际 问题 来 说 ， 
当 样 本 容量 超过 30 就 可 以 认为 是 “足够 大 ”了 . 

例 2.2.5 

一 窝 猪 的 数量 越 多 意味 着 农场 主 可 获得 的 利润 就 越 多 ， 国 家 试验 中 心 正在 研究 一 种 能 
够 提高 每 宽 猪 产量 的 新 技术 ， 记 录 的 55 窝 猪 中 平均 每 窝 存活 猪 的 数量 是 9.8， 且 * = 
1.4.， 这 些 平均 每 窜 存 活 猪 的 总 体 均值 95% 的 近似 置信 区 间 下 限 为 

1.4 


5 = 一 一 ——"O 二 
X 一 “av 9.8 — 1.96 V55 9.43 (18) 
近似 置信 区 间 上 限 为 
yx S = 14 _ 
X + Z1-a 277 = 9.8 + 1.96 "= 10.17 (19) 
Am, ILALA 95% KKP ARAKA RE REE 9.43 与 10.17 之 间 ， 国 
自助 法 


定理 2.2.1 给 出 了 六 的 均值 和 方差 ，5* 的 均值 也 不 难得 到 .但 是 ，5” 的 方差 则 
不 是 那么 容易 计算 . 很 多 统计 量 作为 总 体 参 数 的 估计 量 像 定 理 2.2. 1 那样 从 理论 上 来 
推导 是 非常 困难 ， 甚 至 是 不 可 能 的 ， 所 以 我 们 用 其 他 的 方法 来 估计 它们 的 均值 和 方 
差 ， 其 中 一 种 方法 称 为 自助 法 (bootstrap). 

自助 法 是 从 原始 容量 为 n 的 随机 样本 的 观测 值 中 有 放 回 地 抽取 nn 个 值 ， 也 就 是 
说 ,一些 原 始 随 机 样本 的 观测 值 在 “自助 样本 ”中 可 能 出 现 一 次 ， 多 于 一 次 ,或 者 
根本 不 出 现 ， 自 助 样本 的 个 数 总 是 和 原始 随机 样本 中 观测 值 的 个 数 相等 . 


[87] 
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每 组 自助 样本 都 可 以 计算 出 我 们 所 关心 的 估计 量 通过 计算 机 模拟 ， 我 们 可 以 
由 原始 随机 样本 的 观测 值得 到 成 百 上 千 组 自助 样本 ,每 组 自助 样本 都 会 产生 6 的 一 
个 值 ， 这 成 百 上 千 个 6 估计 值 的 样本 均值 ， 样 本 标准 差 (s 或 5) 可 以 用 来 估计 6 的 
总 体 均 值 和 总 体 标准 差 (标准 误差 )， 事 实 上 ,在 自助 法 中 ， 这 些 6 估计 值 的 经 验 分 
布 函数 可 以 作为 8 的 真实 的 总 体 分 布 函数 的 一 个 估计. 

显然 ， 自 助 法 每 一 步 都 依赖 于 原始 随机 样本 值 ， 不 同样 本 值 的 集合 会 产生 不 同 
估计 值 的 集合 . 

自助 法 重复 试验 次 数 

对 于 简单 估计 一 个 估计 量 的 均值 和 标准 差 ， 自 助 法 的 重复 次 数 很 少 超过 100 或 
200, 25 次 左右 已 经 号 够 但是， 要 得 到 置信 区 间 则 需要 做 大 量 的 重复 试验 . 得 到 0 近 
似 置信 区 间 的 一 种 方法 是 利用 自助 样本 估计 量 信 的 ao/2 和 1 -ov2 的 样本 分 位 数 . Efron 
和 Tibshirane( 1986) 建议 至 少 要 做 250 次 自助 重复 试验 ， 他 们 同时 也 给 出 了 另外 一 种 更 
加 精确 获得 置信 区 间 的 方法 ， 这 种 方法 需要 更 多 的 自助 重复 试验 ， 至 少 要 做 1000 W. 
例 2.2.6 
在 例 2.2.5 中 ， 对 及 用 中 心 极限 定理 ， 得 到 了 每 窜 猪 数量 总 体 均值 的 置信 水 平 为 
95% 的 近似 置信 区 间 . 现在 我 们 用 自助 法 ， 求 出 每 宽 猪 数量 总 体 标准 差 o 的 置信 水 
平 为 95% 的 近似 置信 区 间 ， 这 个 参数 对 检验 是 非常 有 用 的 ， 因 为 每 窜 猪 数量 相差 不 
大 的 情况 (Áo 较 小 ) 要 比 一 些 窝 数量 很 少 而 其 他 的 很 多 (RK) 好 得 多 . 

原始 样本 55 个 观测 值 是 从 1 到 55 的 编号 . 


观测 号 O Og g f. o M 

每 窟 数量 g: g P É acds. TE. s=1.4 
现在 从 1 到 55 号 进行 有 放 回 地 抽样 ， 得 到 55 个 数 ， 得 到 第 一 次 自助 样本 ， 由 它 计 
算出 估计 量 s*. 

自助 样本 #1: 

观测 号 和 

HEHE 6 9 ë I nai 9 (554) s* = 1.6 


这 个 过 程 重复 250 次 〈 自 助 法 的 这 个 过 程 可 以 重复 所 需要 的 尽 可 能 多 的 次 数 ， 但 是 
建议 求 置信 区 间 至 少 需 要 250 次 ). 


自助 样本 想 : 

观测 号 28 23 3 £ ca 8 

每 宽 数 量 10 10 8 De orei 8 ” (55 个 ) ss* = 1.8 
将 这 个 过 程 继续 重 复 下 去 ， 直 到 

自助 样本 #250: 

观测 号 6 1 55 14 ... 17 

每 窟 数量 Ww o D DD -yyy 9 (550) S259% = 1.1 


Hi s* 的 样本 0.025 分 位 数 可 以 得 到 95% 置信 区 间 的 近似 置信 下 限 ,因为 


2.2 4 计 6l 


0.025(250) = 6.25， 四 舍 五 人 到 7， 所 以 置信 区 间 的 下 限 是 第 7 个 次 序 统计 量 ， 
5 ， 由 样本 0. 975 分 位 数 ， 即 第 244 个 次 序 统计 量 (0.975 x250 = 243. 75 Dú 
五 人 到 244) 得 到 ，S*“ 即 为 置信 上 限 、 在 这 个 问题 中 ， 我 们 需要 将 s 的 250 个 值 
从 小 到 大 排序 ， 即 
07 O8 08; 09, 09, 09. 102 0 20 32, 23, 23, 24 27 
从 而 ,95% 置信 区 间 是 从 1.0 到 2.0， 通 过 计算 250 个 HIRNEZ S 而 得 到 的 标准 
误差 的 估计 ， 正 如 由 250 个 s* 的 均值 XxX 可 以 算出 s 均值 的 估计 值 一 样 ， 我们 还 可 以 
算出 其 他 所 关心 的 统计 量 . m 

计算 机 辅助 

几乎 所 有 的 计算 机 中 的 统计 软件 包 ， 甚 至 许多 便宜 的 手动 计算 器 都 可 以 计算 出 
我 们 前 面 所 讨论 的 点 估计 但是， 自助 法 可 不 太 容 易 得 到 ，S-Plus ,SYST4T, Resam- 
pling Stats 和 Stata 等 统计 软件 中 都 可 以 找到 自助 法 的 计算 程序 ， 如 要 查看 有 关 程 序 
方面 的 具体 细节 ， 可 参考 Davison 和 Hinkley(1997) 写 的 关于 再 抽样 的 书 中 有 关 5-Plus 
使 用 方法 的 介绍 . 


一 般 参 数 估 计 


用 两 个 问题 来 概括 估计 一 个 未 知 参数 0 的 大 致 过 程 : 

1. 使 用 哪个 统计 量 ? 建议 仿照 我 们 前 面 所 举 的 例子 中 计算 扩 = 关 ,Fs =S 以 及 分 位 
数 估 计量 + = Q, 的 过 程 ， 看 参数 9 是 怎样 从 总 体 分 布 函数 F(x) 中 定义 的 ， 就 怎样 从 
经 验 分 布 函数 来 定义 参数 0 的 估计 6. 

2. 该 统计 量 是 否 优 良 ? 这 通常 用 一 个 估计 量 的 标准 差 ( 称 为 标准 误差 ) 来 衡量 . 
定理 2.2. 1 给 出 了 义 的 标准 误差 是 o/Yn， 其 他 统计 量 的 标准 误差 并 不 像 均 值 这 样 容 
易 计 算 ， 但 可 以 通过 自助 法 来 估计 ， 自 助 法 还 可 以 给 出 的 整个 分 布 函数 的 售 计 以 
及 的 近似 置信 区 间 . 

口 理论 ”这 种 估计 方法 的 理论 基础 是 随 着 n 的 增 大 ，5(x) 依 概率 趋 于 F(x) (本 书 中 

没有 提 及 “ 依 概率 ”这 个 概念 的 精确 定义 )， 因 此 可 以 用 S(x) 来 估计 F(x) 中 的 参 

数 ， 通 常 大 多 数 情况 下 所 关注 的 估计 量 都 是 趋 于 ( 依 概 率 ) 被 估计 的 未 知 参数 ， 这 

使 得 它们 成 为 一 些 较 为 优良 的 估计 量 ， 从 F(x) 中 重复 抽样 可 以 得 到 估计 量 的 渐 近 分 布 

函数 ， 所 以 只 要 样本 容量 足够 大 ， 从 S(x) 中 重复 抽样 得 到 的 结果 几乎 与 前 者 没有 太 大 

的 差别 ， 关 于 自助 法 概念 的 介绍 ， 请 查阅 Efron 和 Tibshirani( 1986) 的 参考 文献 . 口 
生存 函数 

经 验 分 布 函数 S(x) 将 随机 样本 X ,X,,…,X, 与 总 体 分 布 函数 F( x) 有 机 地 结合 
起 来 ， 因 为 它 用 小 于 等 于 x 观测 值 的 频率 来 估计 P(X<x) =F). 在 寿命 测试 ， 
医疗 后 续 工 作 ， 以 及 其 他 领域 中 ， 和 分 布防 数 同样 有 用 的 是 生存 怠 数 (survival 
function) P(x) =1 -F(x)， 这 里 所 关心 的 变量 为 事物 的 寿命 (lifetime) (MEER 
结束 持续 的 时 间 )， 可 以 是 人 ， 动 物 或 无 生命 产品 的 寿命 ， 也 可 以 简单 地 从 某 个 起 
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点 开始 ， 直 到 某 事件 发 生 ， 如 痊愈 ， 到 达 ， 离 开 等 等 所 持续 的 时 间 . 
P(x) 的 一 个 月 然 估计 是 它 的 经 验 生存 消 数 
P(x) = 1 — S(x) (20) 
AMA X ,X,,…,X, 中 超过 x 值 的 频率 . 
Kaplan-Meier 估计 
Kaplan 与 Meier( 1985 ) 用 X 表示 死亡 时 间 ， 应 当 注 意 ， 由 于 试验 中 某 些 项 的 缺失 
(loss) ， 死 亡 时 间 在 某 些 情况 下 是 不 可 观测 的 ， 比 如 在 试验 中 研究 对 象 的 离开 ， 进 人 
试验 研究 较 晚 ， 或 者 试验 结束 后 才 死 亡 等 等 ， 他 们 提供 一 种 从 缺失 数据 中 获取 信息 
的 方法 ， 即 在 缺失 前 死亡 (death) 还 没有 发 生 ， 他 们 利用 了 下 面 的 事实 : 如 果 和 死亡 
发 生 在 时 刻 x 后 ， 那 么 在 x 前 的 任意 时 刻 后 死亡 仍然 会 发 生 ， 下 面 是 他 们 的 理由 . 
由 条 件 概 率 的 定义 (等 式 1.2.2)， 我们 可 以 得 到 ， 对 于 x。 <x, 
P(X > x1) = P(X > xi, X > xo) = P(X > x, | X > xo)P(X > xo) (21) 
假设 在 第 1 年 初 有 100 个 研究 对 象 参 加 测试 ,第 1 年 底 只 有 30 个 存活 ， 我 们 用 
下 式 估 计 P(1) 
PO) = P(X > 1) = 30/100 = 0.3 (22) 
这 里 X 表示 研究 对 象 个 体 的 寿命 . 
接着 ， 假 设 第 2 年 初 又 有 另外 1000 个 个 体 参 加 试验 ,第 2 年 底 ，1000 个 中 有 
250 个 存活 ， 而 最 初 100 个 中 存活 的 30 ARRAT 10 个 .我 们 可 以 用 最 初 的 100 个 个 
体 来 估计 P(2), 
P (2) = P(X > 2) = 10/100 = 0.1 (23) 
但 此 时 ， 我 们 可 以 用 第 2 年 新 参加 的 1000 个 个 体 的 信息 来 更 新 估计 P(1) ， 因 为 一 年 
中 参加 的 试验 的 个 体 共 有 1100 个 ， 其 中 共有 250 + 30 = 280 个 存活 ， 改 进 后 P(1) 的 
估计 为 
PG) = P(X > 1) = 280/1100 = 0.255 (24) 
进一步 讲 ， 由 1100 个 个 体 中 有 280 个 存活 和 等 式 2. 2.21， 我 们 可 以 用 改进 后 的 P(1) 
来 改进 P(2) ， 得 到 估计 式 
P(2) = P(X > 2) = P(X>2|X>1)P(X >1) (25) 
改进 后 的 估计 P(x >1) 为 0.255， 不幸 的 是 ， 我 们 无 法 改进 P(X>21X>1) 的 估计 值 ， 
因为 我 们 不 知道 在 接 下 来 一 年 的 试验 中 1000 个 观测 有 多 少 个 存活 ， 所 以 我 们 用 下 面 
的 估计 量 
P(X>2|X>1)=10/30 (26) 
因为 它 仅 用 到 了 已 知 信息 ， 即 第 1 ERA 30 个 存活 ,第 2 年 底 有 10 个 存活 ， 那 么 
P(2) 的 改进 估计 就 是 
10 280 27) 


Ê(2) = P(X>2|X> DP(X>1) = 100 00 
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Kaplan 与 Meier 推广 了 上 面 的 方法 ， 应 用 到 了 一 般 的 情况 . 设 u, <u, <…<u RIR 
个 个 体 “ 寿 命 ， 这 里 寿命 是 指 从 开始 到 死亡 ， 或 者 到 研究 缺失 所 持续 的 时 间 . 并 令 
pi = P(X > u;| X > u;-i) (28) 
用 下 式 估 计 
O ANA u 的 存活 的 个 体 数 
Pi T ENA u, 仍然 观测 到 的 存活 个 体 数 


在 时 刻 u, 缺失 的 个 体 ， 可 以 认为 在 时 刻 u, 以 后 仍然 存活 ， 因 为 知道 他 们 在 时 刻 u, 还 
是 活着 的 .而 在 时 刻 u, 死亡 的 个 体 不 可 能 在 时 刻 u, 后 是 存活 的 .在 第 1 次 死亡 或 缺 
失 的 计算 时 ，P, 的 分 母 是 参加 试验 个 体 的 总 数 . 
P(x) 的 Kaplan-Meier 估计 为 
P(x)=1 其 中 x 过 ui 
=]; Hpr>u (30) 


u,<x 


其 中 ， 乘 积 是 对 所 有 寿命 u < x É) i 进行 的 . 注意 ， 这 个 估计 量 是 一 个 递 降 的 阶 
梯 函 数 ， 且 只 在 观测 的 死亡 时 间 取 值 发 生变 化 ， 而 且 由 SCx) =1 -P(x), RE 
方法 可 定义 更 一 般 的 经 验 分 布 函 数 S(x) ， 用 于 针对 缺失 数据 的 研究 . 
计算 机 辅助 
Minitab S-Plus 和 SYSTAT 软件 都 可 以 作 生 存 曲 线 ， 特 别 是 Kaplan-Meier (if. 
在 估计 生存 曲线 时 ， 有 时 我 们 需要 求 出 删 失 数据 的 方差 ， 在 本 书 中 没有 介绍 ， 但 这 
里 提 到 的 软件 包 可 以 解决 这 些 问 题 . 
例 2. 2. 7 
要 测试 10 个 汽车 上 风扇 皮带 的 质量 ,我 们 把 它们 装 到 车 上 ， 并 记录 每 辆 车 上 皮带 
所 能 承受 的 里 程 数 ， 测 试 结束 后 ，5 个 皮带 都 断裂 了 ， 寿 命 〈 以 千 英 里 计 ) 分 别 为 
77 ,47 ,81 ,56 ,80， 另 外 5 ARARA, 分 别 是 62 ,60 ,43 ,71 ,37. 生存 晒 数 的 Kaplan- 
Meier 估计 如 下 所 示 . 


(29) 


1 u, 结果 P. P(u,) 
1 3 缺失 10/10 1 

2 43 缺失 9/9 1 

3 4 死亡 7/8 0.875 
4 56 死亡 6/7 0.75 
5 60 缺失 6/6 0.75 
6 62 fk K: 5/5 0.75 
7 71 缺失 4/4 0.75 
8 77 死亡 2/3 0.5 

9 8 ”死亡 i72 0.25 


10 81 死亡 0/1 0 
对 所 有 x >0，P(x) 的 图 像 如 图 2-3 所 示 . 
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图 2-3 生存 函数 P(x) 的 Kaplan-Meier 估计 Ba 


如 果 没 有 缺失 数据 ， 只 是 死亡 数据 ， 那 么 Kaplan-Meier 估计 和 1 -SCr) 是 一 样 的 ， 
从 P(x) =1 开始 ， 在 每 个 死亡 时 刻 以 1/n 为 阶梯 高 度 下 降 ， 直 到 Ê (x) =0， 如 果 既 
有 缺失 数据 又 有 死亡 数据 ，P(x) 从 1.0 开始， 下降 的 阶梯 高 度 则 不 再 一 致 ， 如 果 在 
最 后 知道 死亡 时 刻 之 后 仍 有 缺失 数据 ， 那 么 P(x) 不 会 下 降 到 0， 并 且 对 于 那些 在 最 
后 已 知 缺失 数据 后 面 的 x， 它 没有 定义 ， 在 这 种 情况 下 ， 通 过 本 章 前 面 介绍 的 常用 方 
法 ， 用 S(x) 来 估计 F(x) 的 某 些 相关 参数 ， 如 均值 ， 方 差 等 是 不 太 合 适 的， 但 是 可 以 
估计 它 的 一 些 分 位 数 . Kaplan 和 Meier( 1958) 也 介绍 了 一 些 特殊 的 方法 . 

在 这 种 意义 下 , 点 估计 是 一 种 非 参数 统计 方法 ， 因 为 不 用 了 解 任 何 关 于 未 知 分 
布 函 数 的 形式 就 可 以 做 出 点 估计 本章 中 的 例子 足以 说 明 这 一 点 . 

很 难说 清 构造 置信 区 间 的 方法 是 参数 的 还 是 非 参数 的 ， 如 果 构 造 置信 区 间 时 不 需 
要 任何 分 布 函 数 的 形式 ， 这 显然 是 非 参数 方法 ， 例 2.2.5 和 2. 2.6 所 示 的 近似 方法 就 是 
非 参数 方法 ， 另 一 方面 ， 如 果 方 法 要 求 未 知 分 布 函 数 是 正 态 分 布 〈 见 定义 1.5.3)， 或 
是 其 他 的 特殊 形式 ， 那 么 这 种 方法 就 是 参数 的 ， 我们 将 在 3.1,3.2,5.1,5.5,5.7 和 6.1 
节 中 介绍 其 他 几 种 构造 置信 区 间 的 非 参 数 方法 . 


习题 
Il. 从 某 一 社区 中 随机 抽取 10 名 居民 ， 他 们 中 5 个 去 年 税 前 收入 分 别 是 (美元 )8600 ,15 200, 
16 200,16 400 和 29 600; 而 其 他 5 个 人 没有 收入 . 
(a) 画 出 经 验 分 布 函数 图 像 (b) 求 收 入 的 样本 中 位 数 . 
(c) 求 收 入 的 样本 均值 . (d) 求 收入 的 样本 方差 . 
(e) 求 收入 的 样本 标准 差 . 


2. 在 五 场 连续 的 比赛 中 ， 某 篮球 队 分 别 得 分 73 ,68 ,86,78 和 65. 


(a) 画 出 经 验 分 布 函 数 图 像 . (b) 求 样本 上 四 分 位 数 . 
(c) 求 样 本 四 分 位 数 极 差 . (d) 求 样本 均值 . 


(e) 求 样本 标准 差 . 


2.2 个 T 65 


随机 抽取 5 个 “12 RRA” 658396 f. HERRER HERAA 12.6,13.0,12.1,11.8 
和 12.1 #7]. 
(a) 画 出 经 验 分 布 函数 图 像 . 
(b) 求 样本 上 下 四 分 位 数 和 四 分 位 数 极 差 . 
6 名 学 生 的 考试 分 数 为 81 ,85 ,89 ,90 ,90 和 98. 
(a) 画 出 经 验 分 布 函数 图 像 . (b) 求 样本 四 分 位 数 极 差 . 
用 本 章 中 相同 的 方法 进行 点 估计 ， 对 于 给 定 的 c， 基 于 与 YY 有 相同 分 布 函 数 的 随机 样本 
Xi ,X;，… X RERE P(Y<c) 的 点 估计 ，、 换 句 话 说， 如 果 2 ,X,,…,X 是 一 组 随机 样 
Æ, HARARE F(x) ， 估 计 F(c). 试 估计 习题 2 的 下 一 场 比赛 中 得 分 超过 80 分 的 概 
率 是 多 少 ? 
用 本 节 介 绍 的 方法 进行 点 估计 ， 和 寻找 估 计量 来 估计 随机 变量 的 极 差 . 样本 的 极 差 会 比 总 
体 极 差 更 大 吗 ? 会 更 小 吗 ? 样本 极 差 的 期 望 值 会 比 总 体 极 差 小 吗 ? 
为 检验 一 市 立 银行 最 小 月 度 结余 ， 从 中 随机 抽取 175 家 支票 账户 ,样本 均值 为 1156 美元 ， 标 
准 差 是 855 美元 ， 求 该 银行 所 有 14 000 家 支票 账户 平均 最 小 月 度 结余 90% 的 近似 置信 区 间 . 
在 一 中 心 高 中 学 生 的 学 习 能 力 测试 研究 中 ， 随 机 抽取 50 名 学 生 ， 平 均 得 分 为 81% ， 标 准 
差 为 11%， 求 该 中 学 1159 名 高 中 生平 均 分 95% 的 置信 区 间 . 
对 健身 俱乐部 18 名 新 成 员 进 行 体能 测试 . 用 X 表示 他 们 中 超重 成 员 的 比例 ，Y 记录 路 自 
行车 锻炼 后 心律 恢复 情况 ， 二 者 样本 相关 系数 为 r=0.35， 为 了 估计 所 有 新 成 员 的 过 去 、 
现在 和 将 来 的 真实 相关 系数 95% 的 置信 和 区间， 我 们 使 用 自助 法 从 小 到 大 排列 300 个 自助 
样本 ,得 到 最 小 的 10 个 r* 值 分 别 是 

—0.15, —0.06, —0.02, 0.01, 0.03, 0.03, 0.05, 0.06, 0.07, 0.09 
最 大 的 10 个 一 值 分 别 是 

0.51, 0.53, 0.53, 0.55, 0.56, 0.57, 0.59, 0.59, 0.60, 0.62. 


求 总 体 相关 系数 95% BJ ur tb B: (ñ X la]. 


. 设 上 面 第 9 题 中 300 个 自助 样本 的 样本 均值 为 0.30， 且 标准 差 为 0.12， 那么 7 的 标准 


误差 的 估计 值 是 多 少 ? 当 样 本 容量 为 多 少时 该 估计 有 效 ? 


为 了 确定 一 批 灯泡 的 生存 函数 ， 从 中 随机 抽取 8 个 灯泡 做 测试 .测试 是 这 样 进行 的 : 先 用 4 


个 灯泡 做 试验 ， 若 其 中 任意 一 个 熄灭 ， 则 用 剩 下 4 个 中 的 任 一 个 灯泡 代替 . 这样 ， 烧 坏 的 
灯泡 的 寿命 分 别 是 187 ,196 ,206 ,210,273 小 时 、 试 验 终止 时 没 烧 坏 的 3 个 灯泡 分 别 亮 了 127, 
190,194 个 小 时 .用 Kaplan-Meier 估计 量 来 估计 该 批 灯 泡 的 生存 函数 ， 


.1997 年 9 H, 100 名 学 生 参 加 了 一 项 关于 牙齿 卫生 的 2 年 计划 项 目 ，72 名 学 生 完 成 了 第 1 


年 的 计划 ，55 名 学 生 完成 了 这 个 2 年 计划 项 目 . 1998 年 9 月 ， 又 有 100 名 学 生 加 入 了 该 
项 目 ，57 名 学 生 完成 了 第 1 年 的 计划 ， 用 Kaplan-Meier 估计 量 来 估计 1999 年 9 月 加 入 该 
项 目的 学 生 能 够 完成 这 个 2 年 计划 项 目的 概率 . 


思考 题 


l. 


因为 估计 量 是 随机 变量 ， 那 么 如 果 给 出 足够 的 信息 ， 我 们 就 能 得 到 它 的 概率 分 布 ， 假 设 
一 个 有 限 总 体 由 4 个 元 素 构成 ， 测 量 值 分 别 为 4,6,7 和 10. 从 该 总 体 中 无 放 回 地 抽取 容 
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量 为 2 的 随机 样本 . 

(a) 随机 样本 共有 和 多少 种 可 能 ? 

(b) 列举 所 有 可 能 的 样本 . 

(c) b 中 每 组 样本 出 现 的 概率 是 多 少 ? 

(d) b 中 每 组 样本 的 样本 中 位 数 是 多 少 ? 

(e) 在 d 中 抽 到 样本 中 位 数 的 概率 是 多 少 ? 

(f) 画 出 样本 中 位 数 的 分 布 函数 图 像 . 

(g) 用 上 面 列 出 的 方法 求 出 样本 极 差 的 概率 函数 . 


2. 一 个 统计 量 称 为 总 体 参数 的 无 偏 估计 量 ， 如 果 满 足 它 的 期 望 等 于 被 估 参 数 . 


(a) 求 思考 题 1 中 的 样本 中 位 数 的 期 望 ， 它 和 和 总体 中 位 数 相等 吗 ? 样本 中 位 数 是 总 体 中 
位 数 的 无 偏 估计 吗 ? 

(b) 求 思考 题 1! 中 的 样本 极 差 的 期 望 ， 它 和 总 体 的 极 差 相等 吗 ? 样本 中 位 数 是 总 体 极 差 
的 无 偏 估 计 吗 ? 《和 习题 6 做 对 比 . ) 


2.3 假设 检验 


统计 推断 有 很 多 形式 ， 其 中 在 非 参数 方法 中 ， 研 究 者 和 应 用 者 广 为 接 受 和 关注 
的 是 假设 检验 ， 在 本 节 和 下 一 节 中 会 详细 介绍 . 

假设 检验 是 根据 样本 来 推断 总 体 的 一 些 给 定 陈述 是 否 成 立 的 过 程 ， 这 些 陈 述 称 
为 假设 ,下 面 是 几 个 包含 陈述 假设 的 例子 : 

1. 女人 比 男人 更 易 发 生机 动车 交通 事故 . 

2. 上 托儿所 能 够 帮助 孩子 在 小 学 学 习 中 取得 更 好 的 成 绩 . 

3. 被 告 有 罪 . 

4. A 牙 育 在 防 时 方面 比 B FREAR. 

特殊 假设 的 非 统 计 检 验 是 很 容易 进行 的 ， 我们 可 以 观测 一 批 和 假设 相关 的 数据 ， 
或 是 不 相关 的 一 批 数 据 ， 或 是 根本 没有 数据 ， 然 后 得 出 接受 或 拒绝 假设 的 结论 ， 尽 
管 这 个 结论 是 可 疑 的 .但 我 们 所 要 讨论 的 假设 检验 的 类 型 是 比较 合理 的 ， 它 称 为 统 
计 假 设 检验 ， 检 验 的 过 程 有 着 合理 的 定义 .这 里 给 出 了 这 种 检验 的 几 个 简要 步 又 : 

l. 假设 是 根据 总 体 提出 的 ， 其 中 包含 两 种 假设 ， 试 验 者 希望 证 实 的 假设 称 为 备 
择 假 设 (alternative hypothesis) ， 或 者 在 质量 控制 中 ， 它 是 指 关 于 产品 或 服务 质量 不 
令 人 满意 或 “失控 ”的 一 些 陈 述 ， 典 型 的 备 择 假设 为 “新 产品 比 旧 产 品 要 好 ,” 或 
“这 种 药 对 治 这 种 病 更 有 效 . " ， 有 时 ， 备 择 假设 也 指 研究 假设 (research hypothesis) . 

和 备 择 假设 对 立 的 称 为 零 假 设 (null hypothesis) 或 检验 假设 (test hypothesis ) . 
这 是 在 假设 检验 中 需要 被 检验 的 假设 . 上面 的 例子 中 和 备 择 假 设 相 对 应 的 零 假设 分 
别 是 “新 产品 不 比 旧 产 品 好 ”, “这 种 药 对 治疗 这 种 病 不 是 更 有 效 ”. 在 质量 控制 中 ， 
零 假设 的 陈述 是 指 关于 产品 或 服务 质量 让 人 满意 的 一 些 陈 述 . 

如 果 样 本 数据 强 有 力 地 与 零 假设 不 一 致 ， 那 么 拒绝 零 假设 如果 样本 数据 和 和 零 假 
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设 不 矛盾 ， 或 是 没有 充足 的 理由 显示 数据 和 零 假 设 有 冲突 ,那么 试验 者 “不 能 拒绝 ” 
零 假 设 ， 有 时 试验 者 也 说 “接受 零 假设 "， 它 所 表达 的 和 前 面 是 同一 个 意思 ， 该 叙述 不 能 
误解 为 数据 证 明 零 假设 是 真 的 . “接受 零 假 设 ” 只 是 表示 不 能 拒绝 零 假 设 . 
2. 选择 检验 统计 量 〈test statistic). 一 个 好 的 检验 统计 量 在 零 假设 成 立时 取 一 些 
值 ， 而 在 零 假 设 不 成 立时 取 另 外 一 些 值 . 也 就 是 说 ， 一 个 好 的 检验 统计 量 在 判断 数 
据 是 否 和 零 假 设 一 致 方面 是 个 敏感 的 指标 . 
3. 根据 检验 统计 量 的 可 能 取 值 ， 构 造 是 否 接受 零 假 设 的 决策 法 则 (decision rule). 
4. 基于 从 总 体 中 抽取 的 随机 样本 ， 从 而 得 到 检验 统计 量 的 取 值 ， 最 后 做 出 是 否 
接受 零 假设 的 判决 . 
下 面 的 例 2. 3. 1 更 加 精确 地 描述 了 上 面 假设 检验 的 这 个 过 程 . 
例 2. 3.1 
某 机 器 生产 零件 ， 当 次 品 率 等 于 或 低 于 5% 时 可 以 认为 该 机 器 工作 正常 ; 高 于 5% 
时 ， 就 需要 对 机 器 引起 注意 ， 零 假设 为 
Ho: 该 机 器 正常 工作 
是 一 个 要 检验 的 假设 . 备 择 假设 为 
H: 需要 注意 该 机 器 

如 果 H, 是 真 的 ， 它 就 是 我 们 要 能 检测 的 假设 ， 从 该 机 器 生产 的 所 有 零件 中 随机 抽 
取 10 个 ， 根 据 这 组 随机 样本 检验 万 .如 果 拒 绝 H,， 我们 需要 采取 修理 措施 来 使 机 
器 正常 工作 . 

假设 每 个 零件 是 次 品 的 概率 均 为 p， 且 是 否 为 次 品 相 互 独立 ， 因 此 ， 在 这 个 假 
设 模 型 中 ， 原 来 的 假设 H, 与 H, 等 价 于 

Ho: p < 0.05 
Hi: p > 0.05 
我 们 知道 ， 如 果 次 品 太 多 ， 就 要 拒绝 H,， 所 以 令 检验 统计 量 了 为 次 品 的 总 个 数 ， 那 
么 ,根据 例 1. 3.5,T 服 从 参数 为 p,n 为 10 的 二 项 分 布 ， 由 表 A3 RDA, Æ H, 
为 真 (p<0.05), 那么 
P(T < 2) 三 0.9885 (1) 
当 p =0.05 时 取 等 号 ， 且 
P(T > 2) < 0.0115 (2) 

当 p =0.05 时 取 等 号 ， 由 于 当 H, 为 真 时 拒绝 H, 的 概率 很 小 ， 即 小 于 等 于 0. 0115， 
所 以 我 们 决定 ,车 TT 超过 2， 则 拒绝 如 ， 样 本 空间 中 对 应 于 大 于 2 那些 样本 点 的 
集合 称 为 临界 域 (critical region). 决策 法 则 为 : 若 观测 结果 在 临界 域 中 〈 了 超过 
2) ， 则 拒绝 M; 否则 接受 Mo. 

假设 10 个 零件 的 随机 样本 中 有 4 个 次 品 ,， 那么 T=4， 拒 绝 零 假 设 ， 则 我 们 认 
为 需要 注意 该 机 器 的 工作 状况 . a 
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在 例 1.3.1 中 ， 针 对 收集 数据 和 这 种 数据 的 类 型 条 件 作 出 了 一 些 假设 ， 在 构造 模 
型 和 理想 化 试验 时 ， 这 些 假设 是 等 价 的 . “在 这 个 模型 下 ”意味 着 “在 这 些 假设 下 ”， 
试验 者 则 尽 可 能 地 在 满足 这 些 假设 的 条 件 下 收集 数据 ， 

在 这 个 模型 下 ， 原 来 的 假设 用 统计 术语 可 以 重新 叙述 为 另 一 种 等 价 的 形式 ， 这 
些 假 设 可 分 为 简单 (simple) 假设 和 复合 (composite) 假设 . 

定义 2. 3.1 车 假设 为 真 ， 则 在 样本 空间 中 只 定义 了 一 个 概率 了 消 数 ， 这 时 称 该 
假设 为 简单 假设 ， 若 假设 为 真 ， 则 在 样本 空间 中 定义 了 两 个 或 更 多 个 概率 函数 ， 这 
时 称 该 假设 为 复合 假设 . 


10 
在 这 个 例题 中 ， 席 型 在 每 个 样本 点 导出 了 二 项 概率 | p01 -p)”“， 其 中 样本 


点 对 应 大 个 次 章 和 10 -kk 个 非 次 品 ， 这 表示 p 决定 了 定义 在 样本 空间 中 的 一 组 概率 饥 
数 ，( 对 于 每 个 样本 点 , kE M) 假设 H, WA, fH p 可 能 是 0 到 0.05 中 任 一 值 ， 则 
有 几 种 可 能 的 概率 函数 ， 且 H, 为 复合 假设 .对 于 BH,， 有 同样 的 结论 ， 假设 “p = 
0. 05” 是 一 个 简单 假设 ， 事 实 上 ， 若 p =0.05 为 真 ， 那么 概率 函数 将 表示 个 次 品 的 


10 
本 点 赋 于 概率 [|(0 05)“(0.95)”“， 这 里 合理 地 定义 了 概率 函数 (不 含 未 知 参 


数 ) ， 且 只 有 一 种 可 能 . 
定义 2. 3.2 一 个 统计 检验 量 是 指 在 假设 检验 中 能 够 帮助 作出 判决 的 统计 量 . 


临界 域 


一 个 好 的 检验 统计 量 应 该 具备 这 样 的 理想 性 质 : 它 把 样本 空间 中 的 点 和 实数 对 
应 起 来 ， 该 样本 空间 中 的 样本 点 是 按照 区 分 零 假设 H, 是 否 为 真 的 能 力 来 排列 的 ， 例 
如 ， 检 验 统计 量 给 那些 最 能 够 帮助 试验 者 决定 拒绝 H, 的 样本 点 赋予 较 大 的 值 ， 给 那 
些 帮 助 试验 者 决定 接受 H, 的 样本 点 赋 较 小 的 值 ， 那 么 检验 统计 量 的 值 越 大 ， 试 验 结 
果 表 明 越 应 该 拒绝 也， 这 样 当 检验 统计 量 的 所 有 值 比 某 一 个 数 都 大 时 ， 则 应 拒绝 
H,， 进 一 步 讲 ， 这 能 够 使 试验 者 不 论 拒 绝 域 多 么 大 还 是 多 么 小 ， 都 能 客观 地 得 出 相 
同 的 结论 ， 拒 绝 域 对 应 检验 统计 量 中 最 大 值 的 检验 称 为 右边 检验 (upper-tailed test). 
同样 ， 若 次 序 相反 ， 那 么 拒绝 域 对 应 检验 统计 量 中 最 小 值 的 检验 称 为 左边 检验 (low- 
tailed test). 

这 两 个 都 是 单 边 检验 (one-tailed test) ， 例 题 中 的 检验 就 是 单 边 的 ， 若 拒绝 域 对 
应 检验 统计 量 中 最 大 值 和 最 小 值 ， 那 么 该 检验 称 为 双边 检验 (two-tailed test) ， 因 为 
拒绝 域 对 应 于 检验 统计 量 可 能 的 两 个 “ 边 ”. 

定义 2. 3.3 临界 域 (critical region) 是 样本 空间 中 使 得 拒绝 零 假 设 全 体 样 本 点 
的 集合 . 

有 时 临界 域 亦 称 为 拒绝 域 (rejection region) ， 所 以 很 明显 样本 空间 中 不 在 临界 域 
的 全 体 样 本 点 的 集合 称 为 接受 域 (acceptance region). 
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错误 类 型 


在 假设 检验 中 有 可 能 作出 两 种 类 型 的 错误 判决 . 如 果 零 假设 为 真 ， 而 我 们 错误 
地 拒绝 了 它 ， 那么 我 们 所 犯 的 错误 是 第 一 种 错误 (error of the first kind) ， 亦 称 第 一 
类 错误 (type I error). 也 就 是 说 ， 当 丙 为 真 ， 而 我 们 试验 的 结果 却 落 在 临界 域内 
时 ， 即 发 生 了 第 一 类 错误 . 

定义 2. 3.4 第 一 类 错误 是 拒绝 了 正确 零 假设 的 错误 . 

假设 检验 中 另外 一 类 错误 是 指 当 零 假 设 为 假 时 ， 却 接受 了 零 假 设 ， 这 类 错误 是 
第 二 种 错误 (error of the second kind) ， 亦 称 第 二 类 错误 (type Il error). 

定义 2.3.5 第 二 类 错误 是 接受 了 不 正确 零 假 设 的 错误 . 


显著 性 水 平 


这 两 类 错误 可 以 和 一 定 的 犯错 误 概率 联系 在 一 起 ， 首 先 考虑 犯 第 一 类 错误 的 
概率 . 

定义 2.3.6 显著 性 水 平 (level of significance) a 是 拒绝 正确 零 假设 的 最 大 
概率 . 

显著 性 水 平 可 以 这 样 求 得 : 首先 假设 零 假设 H, 成 立 ， 然 后 确定 一 样本 点 落 入 临 
RREZ. WME H, 是 简单 假设 ,那么 及 成 立 只 产生 一 个 定义 在 样本 空间 上 的 概 
率 函数 ， 则 a 是 把 临界 域 中 所 有 点 的 概率 加 到 一 起 的 总 和 .但 是 通常 在 假设 H, 为 真 
时 ， 通 过 计算 检验 统计 量 取 某 个 值 的 概率 来 确定 a 会 更 容易 些 ， 而 这 个 值 应 导致 拒 
绝 H... 


Fat 


在 统计 假设 检验 中 ， 了 解 在 零 假设 成 立时 检验 统计 量 的 概率 分 布 是 非常 必要 的 ， 
这 称 为 检验 统计 量 的 零 分 布 (null distribution). 

定义 2. 3.7 检验 统计 量 的 零 分 布 是 当 零 假设 成 立时 ， 检 验 统 计量 的 概率 
分 布 . 

在 例 2.3.1 中 ,检验 统计 量 T ( 即 10 个 零件 中 次 品 的 个 数 ) 的 零 分 布 是 参数 p< 
0.05 的 二 项 分 布 ， 这 是 由 于 我 们 假设 了 独立 性 和 概率 p 是 常数 .每 个 统计 假设 检验 
的 显著 性 水 平 都 可 以 由 检验 统计 量 的 零 分 布 得 到 . 

如 果 H, 是 一 复合 假设 ，a 是 拒绝 H, 的 最 大 (maximum) 概率 ， 这 里 的 最 大 值 
是 当 零 假设 成 立时 ， 所 考虑 的 概率 分 布 可 能 值 的 最 大 值 ， 在 这 个 例题 中 ，A, 是 复合 
的 ， 那么 对 每 个 不 同 的 p 值 ， 拒 绝 正确 零 假设 的 概率 为 

P( 拒绝 Ho) = P(T > 2|Ho 为 真 ) 


19 110 ; 10—i 
= 之 (! p(1—p)"'; p<0.05 (3) 
i=3 


70 第 2 章 统计 推断 


但 式 3 中 的 概率 当 p 取 最 大 值 时 ， 它 达到 最 大 值 ， 在 H, F, p 的 最 大 值 是 0.05， 所 
以 由 表 A3 或 式 2， 显著 性 水 平 由 下 式 给 出 
a = max P(T > 2| Ho 为 真 ) 

= P(T >2 |p = 0.05) 

= 0.0115 (4) 
很 显然 ， 显著 性 水 平 有 时 称 为 临界 域 的 大 小 (size of the critical region). AX, # H, 
RY, 拒绝 H, 的 最 大 概率 是 w， 则 接受 有 H，( 即 作 出 正确 判决 ) 的 最 小 概率 是 1 -a 

犯 第 二 类 错误 的 概率 用 8 表示 .显然 在 假设 检验 中 我 们 希望 a 和 都 接近 于 零 . 

在 实际 应 用 中 ， 样 本 容量 可 以 帮助 我 们 决定 a 和 有 B 会 有 多 小 .只 有 当 样 本 包含 了 总 
体 所 有 的 信息 时 ， 犯 错误 的 可 能 性 才 可 能 被 完全 消除 . 


功效 


假设 H, 为 假 ， 接 受 H, 的 概率 是 B， 或 是 拒绝 H, 的 概率 是 1 -B， 后 面 这 一 概率 
表示 了 该 检验 检测 错误 零 假 设 的 检验 功效 (power of the test). 

定义 2.3.8 功效 (power) 是 拒绝 错误 等 假设 的 概率 ， 记 为 1-A. 

与 a 不 同 ， 功 效 不 总 是 唯一 的 ， 如 果 互 是 简单 假设 ， 那 么 由 孔 成 立 (等 价 
于 “H。” 为 假 ) 所 导出 的 概率 函数 只 有 一 个 ， 即 一 个 拒绝 忌 , 的 概率 ， 或 得 到 一 个 
落 人 临界 域 的 样本 点 .因此 这 时 1 -B 唯一 ， 如果 总 是 复合 假设 ,那么 在 已 下 的 
每 一 个 概率 函数 都 会 有 不 同 的 1-B 值 ， 这 时 ， 功效 取决 于 多 个 不 同 可 能 的 概率 
函数 . 


决定 
接受 Ho 拒绝 Ho 
真实 5 正确 判决 第 一 类 错误 
情形 “了 正确 概率 = 1 一 a 概率 = a( 显 著 性 水 平 ) 
| 第 二 类 错误 正确 判决 


前 面 已 经 讨论 了 错误 的 类 型 ， 现 在 我 们 转向 讨论 临界 域 . 尽管 我 们 已 经 讨论 了 
一 些 有 关 临 界 域 的 内 容 ， 但 并 没有 涉及 到 它 是 如 何 选取 的 .如果 检验 统计 量 已 经 选 
定 ， 并 由 它 确定 了 单 边 或 是 双边 检验 ， 那 么 临界 域 的 选择 只 取决 于 试验 者 对 临界 域 
大 小 ， 即 显著 性 水 平 的 偏向 ， 通 常 ， 显 著 性 水 平 a 的 减 小 会 伴随 着 p 的 增加 ， 在 假 
设 检验 中 ， 我 们 的 两 个 目标 是 : 若 H, 为 真 ， 那 么 以 最 小 的 可 能 性 拒绝 H Æ H, A 
假 ， 那么 以 最 大 的 可 能 性 拒绝 H,， 所 以 在 那些 有 固定 大 小 的 a 的 点 集中 ， 临 界 域 通 
常 是 那些 1 -B 最 大 值 所 对 应 的 样本 点 的 集合 。 习 惯 上 ，a 通常 取 0.05 或 0.01， 并 且 
临界 域 还 要 根据 检验 统计 量 的 可 能 值 来 确定 . 
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检验 的 p- 值 


如 果 引 入 检验 的 p- 值 (p-value) ， 假 设 检验 的 结果 会 更 有 意义 . 

定义 2.3.9 检验 的 p- 值 是 根据 已 知 观测 ， 零 假设 被 拒绝 时 的 最 小 显著 性 水 平 . 

令 tw 表示 检验 统计 量 了 的 观测 值 。， 在 右边 单 边 检验 中 ，p- 值 是 由 7T 的 零 分 布 计 
算得 到 的 P(T>iw) 值 ， 在 左边 单 边 检验 中 p- 值 是 P(T=<t,.). 

在 双边 检验 中 ，p- 值 规定 为 单 边 检验 中 两 个 p- 值 中 较 小 值 的 2 48. 严格 来 讲 ， 如 
果 了 的 零 分 布 是 离散 的 ， 并 且 拒 绝 域 的 右边 和 左边 概率 不 相等 ， 这 不 太 可 能 在 两 边 
构造 概率 相等 而 精确 的 显著 性 水 平 ， 所 以 这 和 前 面 的 定义 是 不 一 致 的 . 但 是 ， 为 了 
避免 定义 模糊 ， 我 们 在 后 面 还 是 认为 双边 的 产值 是 观测 值 落 在 零 分 布 单 边 概率 的 
2 售 . 

例 2. 3. 1 中 的 检验 是 右边 的 ， 了 的 观测 值 是 4， 所 以 由 表 A3 可 知 p- 值 为 P( T>4 
lp =0.05) =0.0010. p- 值 有 时 简写 为 p, 但 是 在 例 2.3.1 中 这 个 符号 表示 次 品 的 概 
率 ， 所 以 这 里 最 好 用 “P- 值 ”以 免 混 消 . 

在 许多 发 表 的 研究 结果 中 ， 统 计 检 验 浓 缩 为 只 包括 检验 的 名 称 ， 假 设 和 产值 的 
报告 ， 若 p- 值 小 于 或 等 于 a， 则 拒绝 零 假设 ,这 里 o 通常 取 0. 05. 
例 2. 3.2 
为 了 检验 上 过 和 没 上 过 幼儿 园 的 孩子 在 学 习 上 是 否 表现 不 同 ， 选 择 12 个 三 年 级 的 
学 生 进 行 研究 ， 其 中 4 个 上 过 幼儿 园 ， 要 检验 的 零 假 设 是 

Ho: 三 年 级 学 生 学 习 上 的 表现 不 取决 于 他 们 是 否 上 过 幼儿 园 


备 择 假设 是 
Hi: 学 习 上 的 表现 和 上 过 幼儿 园 之 间 是 不 独立 的 
模型 假设 这 12 个 孩子 是 所 有 三 年 级 学 生 中 的 一 组 随机 样本 ， 并 且 根 据 学 习 成 绩 
(从 好 到 差 ) 把 这 些 孩 子 从 1 到 12 排序 标记 . “不 独立 ”是 指 上 过 幼儿 园 的 孩子 整 
体 比 没 上 过 幼儿 园 的 孩子 表现 好 ， 或 整体 表现 不 好 .在 这 个 模型 下 ， 假 设 可 以 重新 
叙述 为 
Ho: 上 过 幼儿 园 的 4 个 孩子 的 秩 是 秩 1 到 12 的 一 个 随机 样本 


Hi: 上 过 幼儿 园 的 4 个 孩子 的 秩 整体 比 12 个 孩子 中 随机 抽取 4 个 孩子 的 秩 要 大 或 小 


我 们 选择 一 检验 统计 量 T， 是 上 过 幼儿 园 的 4 个 孩子 的 秩 和 .我 们 令 那 些 与 很 大 或 
很 小 的 了 值 对 应 的 样本 点 构成 拒绝 域 ， 所 以 该 检验 是 双边 的 . 
每 一 个 可 能 的 结果 是 从 1 到 12 中 抽取 的 4 个 数 ， 且 对 应 着 上 过 幼儿 园 的 4 个 孩 
12 
子 的 秩 ， 所 以 样本 空间 中 有 | 。 | = 495 个 点 ， 为 了 决定 临界 域 包含 哪些 点 ， 我 们 将 外 
W H, 为 真 ， 并 且 在 决定 临界 域 时 ， 看 一 下 a 
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如 果 H, 为 真 ,4 个 孩子 的 秩 应 当 是 12 种 可 能 中 的 一 组 随机 样本 ， 因 此 每 4 个 秩 的 
选择 都 是 等 可 能 性 的 ， 这 样 样本 空间 中 的 每 个 点 概率 相等 ， 它 为 1/495， 这 样 H, 是 一 简 
单 假 设 ， 因 为 我 们 决定 用 双边 检验 ， 所 以 看 一 下 了 较 大 和 较 小 值 所 对 应 的 样本 点 ， 了 
可 能 的 最 大 值 和 最 小 值 是 42 和 10， 对 应 的 样本 点 分 别 是 〈12,11,10,9》 和 《1,2,3， 
4). 了 其 他 的 大 值 和 小 值 所 对 应 的 试验 结果 如 下 所 示 : 


T 样本 点 T 样本 点 
10 (1,2,3,4 42 (9,10, ,11,12) 
11 (1,2,3,5) 4 (8,10, 11,12) 
12 (1,2,3,6) 40 (7,10, 11, 12) 
12: ii 40 (8,9,11, 12) 
39 {6, 10, 11, 12) 
39 (7,9,11, 12) 
39 (8,9,10, 12) 
38 (5,10, 11, 12) 
38 (6,9,11, 12) 
38 (7,8,11, 12) 
(1, 38 (7,9,10, 12) 
14 (2,3,4,5) 38 (8 9,10, 11) 


注意 到 有 12 个 样本 点 对 应 于 T<14, # 12 个 样本 点 对 应 于 T=38， 假 如 临界 域 由 所 有 
T<14 或 T=38 对 应 的 样本 点 组 成 ， 则 a 为 


x = 临界 域 中 的 点 数 
样本 空间 中 的 点 数 


24 
二 :过 > 二 5 
95 0.0485 (5) 


因为 在 H, 下 ,样本 空间 中 所 有 的 样本 点 的 概率 相等 ， 我们 的 决策 法 则 是 : 若 T 了 的 观 
测 值 三 14 或 =38 ， 我 们 拒绝 及 ;否则 我 们 接受 H,. 

经 过 观测 ， 上 过 幼儿 园 的 孩子 在 12 个 孩子 中 学 习 成 绩 的 排序 分 别 是 2,5,6 和 9， 得 到 
T (ÈX: 


` 


` 


小 四 中 内 中 中 区 中 


"ii 


` 


一 一 
+ 
Am 
` ` Ep ` ` 
wbhbibwmhbbb 
KOS Kua KS 


T = 22 (6) 
所 以 我 们 接受 五 ， 由 正 态 分 布 可 以 得 到 p- 值 的 近似 值 (参考 例 1.5.7). 左边 
p- 值 是 当 零 假设 成 立时 ，T = 22 或 更 小 值 的 概率 ， 由 定理 1.4.5 可 以 得 到 了 的 均 
值 和 方差 ， 分 别 为 26 和 34.67 (n=4,N=12)， 所 以 了 的 标准 差 为 5.888. 由 表 
Al ， 正 态 近似 为 
22 — 26 


= 一 一 -一 | 一 < — 0.6794) = 0.248 (7) 
P(T <22) p (z< 5 888 J P(Z ) 


它 的 2 倍 则 是 双边 检验 p- 值 0. 496. 
这 么 大 的 产值 表明 了 在 零 假 设 成 立时 ，7 的 观测 值 是 所 期 望 的 ， 因 此 由 数据 ， 
我 们 没有 理由 怀疑 零 假设 不 正确 . mi 
例 2.3.2 中 所 示 的 检验 过 程 叫 做 Mann-Whitney 检验 或 Wilcoxon 检验 .我们 将 在 


2.3 假设 检验 B 


第 5 章 就 它 的 多 种 形式 进一步 讨论 . 鲍 2. 3. 2 中 的 数据 采用 的 是 度量 的 次 序 尺 度 ， 我 
们 不 需要 知道 每 个 孩子 学 习 成 绩 的 具体 数值 ， 事 实 上 ， 这 种 具体 数值 所 反映 的 信息 
通常 没有 什么 价值 ， 因 为 每 个 学 校 ， 甚 至 每 个 老师 对 这 些 数 值 都 有 不 同 的 解释 和 标 
准 ， 而 这 种 排序 则 有 通用 的 解释 . 


例 2.3.1 给 出 了 对 名 义 数据 的 分 析 ,“ 次 品 ”或 “ 非 次 品 "， 例 2.3.1 中 的 检验 是 基 


于 二 项 分 布 的 ， 这 种 检验 和 其 他 基于 二 项 分 布 类 型 的 检验 将 在 第 3 章 中 正式 介绍 . 


计算 机 辅助 


绝 大 多 数 的 统计 软件 包 都 能 够 做 假设 检验 ， 在 一 些 软 件 包 中 ,使 用 者 指定 零 假 
设 和 备 择 假设 ， 然 后 该 软件 包 给 出 p- 值 ， 而 在 其 他 的 软件 包 中 ， 计算 机 总 是 给 出 双 
边 检验 的 p- 值 ， 使 用 者 必须 决定 该 值 是 否 为 我 们 要 求 的 ,或 是 必须 取 其 一 半 的 值 而 
得 到 一 单 边 p- 值 ， 若 p- 值 小 于 等 于 使 用 者 给 定 的 显著 性 水 平 ， 那 么 则 拒绝 零 假设 . 

很 多 计算 机 软件 包 使 用 近似 方法 来 求 p- 值 ， 大 多 数 情 况 下 这 是 可 行 的 ,但 是 并 
不 是 所 有 情形 都 可 行 。 越 来 越 多 的 计算 机 软件 包 在 仿照 StarXact 的 例子 , 它 计 算 精 确 的 
P- 值 ， 或 当 精确 的 p- 值 在 实际 中 不 能 得 到 时 ， 运 用 蒙特 卡 洛 模 拟 法 得 到 近似 的 p- 值 . 


习题 


l. 检验 一 种 新 的 教学 方法 是 否 比 现行 的 教学 方法 更 好 . 
(a) 合适 的 H, 和 H, 分 别 是 什么 ? 
(b) 问题 中 “显著 性 水 平 ”表示 的 是 什么 ? 
(c) 问题 中 “功效 ”表示 的 是 什么 ? 
2. 法 宣 审 判 被 告 ， 在 证 明 被 告 有 罪 前 ,假设 被 告 是 无 罪 的 . 
(a) 谁 在 做 假设 检验 ? 
(b) H, 和 H, 分 别 是 什么 ? 
(c) 样本 和 总 体 是 什么 ? 
(d) 问题 中 的 “显著 性 水 平 ” 和 “功效 ”分 别 意味 着 什么 ? 
3. 对 于 下 面 的 每 一 项 ， 合 适 的 H, 是 什么 
(a) H,: 肥料 B 至 少 和 肥料 4 一 样 好 . 
(b) Ho: RIFA FHE. 
(c) H,: 太阳 黑子 的 出 现 不 会 影响 经 济 周期 . 
4. 对 于 下 面 的 每 一 项 ， 合 适 的 H, 是 什么 ? 
(a) H: 该 研究 对 象 有 超 感知 觉 ， 
(b) H,: 探测 杆 在 发 现 水 源 中 很 有 作用 . 
(c) H: 年 平均 气温 正在 上 升 . 
5. 一 枚 硬币 掷 $ 次 ， 记 录 正 面 或 反面 出 现 的 观测 结果 ， 临 界 域 是 “至 少 4 次 出 现 正 面 ”的 
事件 ， 假 如 H, 正确 ,那么 样本 空间 的 所 有 的 样本 点 概率 相等 ，a 是 什么 ? 假如 H, 成 立 ， 
每 次 投掷 时 ,“ 正 面 ”出 现 的 概率 为 0.6， 功 效 是 多 少 ? 
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6. 一 枚 硬币 掷 4 次 ， 临界 域 是 “不 多 于 1 次 正面 ”的 事件 . 令 p=P (正面 出 现 ). 假设 H: 
p=0.5 和 Hl:p=0.1， 求 该 检验 的 功效 这 个 问题 中 还 应 该 做 出 哪些 题目 中 未 提 及 的 其 
他 的 假设 ? 

7. 样本 空间 包含 10 个 样本 点 ,临界 域内 只 有 一 个 样本 点 .假如 H, 成 立 ， 那 么 所 有 的 样本 
点 概率 相等 ， 假 如 H, 成 立 ， 临 界 域 中 的 样本 点 概率 为 0.91， 其 他 每 个 样本 点 的 概率 是 
0.01,a 是 什么 ? 功效 是 多 少 ? 

8. 假设 样本 空间 包含 50 个 样本 点 ， 其 中 2 个 样本 点 分 别 命 名 为 A 和 B. 假如 零 假 设 成 立 ， 
则 所 有 的 样本 点 概率 相等 .假如 备 择 假设 成 立 ， 则 样本 点 A 和 B 发 生 的 概率 是 其 他 48 个 
样本 点 的 26 倍 ， 而 这 48 个 样本 点 等 概率 ， 临 界 域 由 A F B 组 成 . 

(a) 求 出 显著 性 水 平 a (b) 求 出 功效 . 


思考 题 


l. EPPA 12 个 塑料 筹码 ， 从 1 到 12 连续 标号 ， 该 试验 是 从 镀 中 有 放 回 地 随机 抽取 2 个 筹 
码 ， 试 验 结果 由 2 个 筹码 上 的 号 码 按照 抽取 次 序 构成 ， 令 检验 统计 量 X 为 抽取 的 筹码 上 
HAFTEM, FREH X hF S 的 样本 点 构成 的 .假如 H, 成 立 ， 则 筹码 的 抽取 是 随 
机 的 ， 如 果 假 如 H, 成 立 ， 则 抽取 筹码 1,2 ,3 的 概率 是 抽取 其 他 筹码 概率 的 2 倍 . 

(a) 列举 临界 域 中 的 样本 点 . (b) RH a. 
(c) 求 出 功效 . (d) H, 和 H, 是 简单 假设 还 是 复合 假设 ? 
(e) 是 单 边 检 验 还 是 双边 检验 ? 


2. 7 个 筹码 从 1 到 7 连续 标号 ， 独 立地 放 到 A 和 B 两 个 盒子 里 .试验 结果 由 盒子 A 中 的 筹 


码 号 码 组 成 ， 不 计 放 和 人 的 次 序 ， 令 检验 统计 量 X 是 盒子 A 中 的 筹码 标号 的 总 和 ， 临 界 域 
是 由 和 值 小 于 6 的 样本 点 构成 的 .假如 H, 成 立 ， 则 每 个 筹码 放 人 盒子 A 中 的 概率 为 0. 5， 
假如 H, 成 立 ， 则 该 概率 为 0. 3. 

(a) 列举 临界 域 中 的 样本 点 . (b) 求 出 a 

(c) 求 出 功效 . (d) H, 和 H, 是 简单 假设 还 是 复合 假设 ? 

(e) 是 单 边 检验 还 是 双边 检验 ? 


2.4 假设 检验 的 性 质 


假设 一 旦 确定 后 ， 对 于 检验 零 假 设 通常 有 几 种 假设 检验 方法 ， 为 了 从 中 选择 一 
种 方法 ， 我 们 要 仔细 考虑 这 些 检验 的 一 些 性 质 ， 其 中 最 重要 的 一 个 问题 是 :“ 这 个 检 
验 的 假设 条 件 适 用 于 我 的 试验 吗 ?” 如 果 答 案 是 “不 适用 ”， 那 么 我 们 可 能 不 能 用 这 
个 检验 ， 但 是 ， 在 舍弃 这 个 检验 前 ， 应 该 明确 检验 背后 的 假设 条 件 . 例如 ， 大 多 数 
参数 检验 中 所 做 的 一 个 假设 是 被 检验 的 随机 变量 服从 正 态 分 布 ， 进 一 步 研究 表明 ， 
若 随机 变量 的 分 布 只 要 稍微 与 正 态 分 布 有 相似 之 处 ， 检 验 仍 近似 有 效 ， 所 以 隐 仿 的 
假设 是 “近似 正 态 ”， 并 且 若 假设 条 件 是 “近似 成 立 ” 的 ， 那么 该 假设 不 应 该 舍弃 . 
但 是 ， 该 检验 的 不 足 之 处 应 有 所 记录 .另外 一 个 准则 就 是 在 模型 中 相对 于 有 较 多 假 
设 条 件 的 检验 ， 我 们 更 喜欢 有 较 少 假设 条 件 的 检验 . 
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有 了 两 个 原因 说 明 检 验 的 假设 条 件 不 满足 时 ， 我 们 仍然 使 用 该 检验 是 危险 的 ， 首 
先 ， 拒 绝 零 假设 不 是 因为 由 数据 指出 的 零 假 设 是 错误 的 ， 而 是 由 于 数据 表明 检验 的 
其 中 一 个 假设 条 件 不 成 立 . 第 二 个 危险 是 ， 有 时 数据 明显 地 表示 零 假 设 是 错误 的 ， 
并 且 模 型 中 一 个 错误 假设 也 影响 着 数据 ， 但 是 在 检验 中 ， 这 两 种 影响 相互 抵消 了 ， 
所 以 这 个 检验 什么 也 没 揭示 就 接受 了 有 零 假 设 ， 一 般 的 假设 检验 不 仅 对 错误 的 假设 敏 
感 ， 同 时 对 模型 中 错误 的 假设 条 件 也 一 样 灵敏 . 

基于 前 面 的 准则 ， 我 们 从 适合 的 检验 中 ,根据 检验 的 其 他 性 质 来 选择 最 好 的 检 
验 . 本 节 将 在 后 面 对 有 关 性 质 具体 定义 ， 它 们 是 

1. 检验 应 是 无 偏 的 . 

2. 检验 应 是 相合 的 . 

3. 在 某 种 意义 上 ， 检 验 应 比 其 他 的 检验 更 有 效 . 

其 中 ， 最 重要 的 也 是 被 广泛 应 用 的 是 有 关 功 效 的 有 效 人 性 . 

有 时 ， 一 个 检验 能 满足 上 面 三 条 标准 中 的 一 两 条 ， 我 们 就 很 满意 了 .很 少 有 三 条 
能 够 同时 满足 的 ， 本 节 后 面 将 要 讨论 检验 的 无 偏 性 、 相 合 性 、 有 效 性 和 检验 的 功效 . 


功效 函数 


#H 是 复合 假设 ， 功 效 随 着 概率 函数 的 变化 而 变化 . 如 果 也 是 按照 某 些 未 知 
参数 来 陈述 的 ， 那 么 功效 通常 作为 该 参数 的 函数 形式 给 出 ， 这 种 函数 称 为 功效 函数 
(power function) ， 可 用 代数 形式 和 图 像 来 表达 .功效 是 当 H, 成 立时 拒绝 H, 的 概率 ， 
和 功效 不 一 样 ， 功 效 函 数 通常 是 对 在 H, 和 H, 下 参数 的 所 有 值 而 定义 的 . 这样 说 来 ， 
功效 函数 比 功效 给 了 我 们 更 多 的 信息 ， 它 是 当 到 成 立 或 不 成 立时 ， 拒 绝 H, 的 概率 . 
例 2. 4. 1 
例 2. 3. 1 中 的 临界 域 是 由 10 个 抽样 产品 中 多 于 2 个 次 品 的 所 有 样本 点 组 成 的 ， 在 模 
型 的 假设 下 ， 样 本 点 落 到 临界 域 的 概率 ， 同 拒绝 H, 的 概率 相等 ， 即 

有 (110 iv o-i 1 a Š (10) i v0-i 
paro = 之 (yj 站 “=1 S (P) p)' (l) 
这 里 p 是 次 品 率 ， 拒 绝 H, 的 概率 是 的 函数 ， 由 表 A3 可 以 画 出 该 功效 函数 的 大 致 图 像 


p P( 拒 绝 Ho) p P(3B#8 H.) 
0 0.0000 0.50 0.9453 


0.05 0.0115 0.55 0.9726 
0.10 0.0702 0.60 0.9877 
0.15 0.1798 0.65 0.9952 
0.20 0.3222 0.70 0.9984 
0.25 0.4744 0.75 0.9996 
0.30 0.6172 0.80 0.9999 
0.35 0.7384 0.85 1.0000 
0.40 0.8327 0.90 1.0000 


0.45 0.9004 1.00 1.0000 
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如 图 2-4 所 示 ， 零 假设 陈述 了 p 在 0 到 0.05 Z|]. H, 成 立时 ， 图 2-4 中 曲线 的 最 大 

值 是 显著 性 水 平 ， 由 前 面 式 2.3.4 计算 等 于 0.0115. 功效 的 取 值 范围 是 从 0. 0115 

(Pp 约 为 0.05) 到 1.0000 (p 等 于 1.0). m 

根据 它们 的 功效 函数 可 以 比较 这 两 种 检验 ， 这 种 比较 的 基础 在 本 节 后 面 定义 了 
相对 效率 后 再 作 讨论 . 
PAES Ho) 


Rn EE p 
0 pc. 01 02 03 04 05 06 07 08 09 1. 
k” EE 


Hi 
2-4 ”功效 函数 
计算 机 辅助 


检验 的 功效 是 显著 性 水 平 ， 所 论 的 简单 备 择 假设 和 样本 容量 的 函数 . 计算 机 软 
件 包 PASS 在 给 定 显著 性 水 平 ， 备 择 假 设 中 参数 的 取 值 范围 和 样本 容量 后 ， 可 以 计算 
检验 的 功效 ， 在 给 定 功效 时 ， 它 也 可 以 计算 出 要 求 的 样本 容量 .Minirab 也 可 以 计算 
一 些 非 参数 检验 的 功效 . 


无 偏 检验 


显然 ， 我 们 希望 拒绝 H, 的 可 能 性 ， 在 H, 不 成 立时 要 比 H, 成 立时 大 . 

定义 2.4.1 无 偏 检 验 (unbiased test) 是 H, 不 成 立时 拒绝 H, 的 概率 大 于 等 于 
H, 成 立时 拒绝 H, 的 概率 的 检验 . 

因此 无 偏 检 验 的 功效 至 少 和 显著 性 水 平一 样 大 ， 一 个 检验 不 是 无 偏 的 则 称 为 有 
偏 检 验 (biased test)， 例 2.3.1 中 描述 的 检验 和 本 节 例 2.4. 1 中 进一步 讨论 的 检验 都 
是 无 偏 检验 ， 这 从 图 2-4 中 显然 可 以 看 出 . 


相合 检验 


检验 的 另 一 个 优良 性 质 是 相合 性 (consistent), 虽然 我 们 说 一 个 检验 是 “相合 
的 ”或 是 “不 相合 的 ”， 其 实 这 里 的 相合 是 针对 一 系列 检验 而 言 的， 因为 它 是 当 样本 
容量 趋 于 总 体 容 量 时 所 使 用 的 ， 为 方便 起 见 ， 无 论 总 体 容 量 有 限 还 是 无 限 ， 我 们 都 
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将 称 总 体 容量 “无 限 ”". 从 技术 上 讲 ， 因 为 样本 空间 和 临界 域 是 随 着 样本 容量 的 改变 
而 改变 的 ， 所 以 对 于 每 个 不 同 的 样本 容量 ， 我 们 都 得 到 一 个 不 同 的 检验 . 因此 ， 随 
着 容量 的 增加 ， 我 们 考虑 一 个 检验 序列 ， 每 一 个 样本 容量 都 对 应 一 个 检验 . 

定义 2. 4.2 称 一 检验 序列 对 及, 中 所 有 备 择 假设 是 相合 的 ， 如 果 对 于 H, 下 的 
每 一 个 可 能 固定 的 备 择 假设 ， 当 样本 容量 趋 于 无 穷 时 ， 检 验 的 功效 趋 于 1.0. 而 序列 
中 每 个 检验 的 显著 性 水 平 ， 尽 可 能 地 趋 于 但 不 超过 某 一 固定 的 显著 性 水 平 值 c > 0. 
例 2. 4.2 
我 们 要 检验 是 否 某 一 性 别 的 婴儿 出 生 率 较 高 ， 而 不 是 男 婴 和 女 婴 出 生 概率 相等 ， 即 
要 检验 

Ho: 男 坚 和 女 砚 出 生 概 率 相 等 
备 择 假设 是 
Hi: 男 婴 比 女 婴 出 生 的 概率 大 ， 或 者 小 
抽样 总 体 由 某 一 国家 登记 的 新 生 婴 儿 构 成 ， 对 于 给 定 的 n 值 ， 样 本 由 最 后 登记 的 n 
个 婴儿 构成 ， 我 们 假设 这 种 抽样 方法 在 尽 可 能 考虑 到 性 别 特 征 的 情况 下 等 价 于 随机 
抽样 ， 假 定 男 婴 出 生 的 概率 p 是 常数 ， 并 且 事 件 生 “ 男 ”和 生 “ 女 ”是 相互 独立 
的 ， 那 么 这 些 假设 等 价 于 如 下 
Ho:p=1/2 
Hı:p#1/2 

令 检验 统计 量 T 为 出 生男 婴 的 数目 ， 临 界 域 选 择 为 对 称 地 对 应 到 了 的 最 大 和 最 小 
值 ， 分 别称 为 了 的 右边 和 左边 ， 最 大 显著 性 水 平 不 超过 0. 05. 

因此 ， 我 们 就 给 出 了 整个 检验 序列 ， 其 中 每 个 检验 对 应 着 样本 容量 的 每 一 个 取 
值 ， 都 是 双边 的 ， 显 著 性 水 平 为 0. 05 或 更 小 ， 且 了 服从 二 项 分 布 ， 对 于 各 种 检验 ， 
Dixon(1953 ) 给 出 的 临界 域 如 下 : 


T 值 对 应 的 临界 域 N 
5 无 0 
6 T=0 各 T=6 0.03125 
8 T=0 和 T=8 0.00781 
10 T<S1 和 T> 9 0.02148 
15 T<3 和 T > 12 0.03516 
20 T<5 和 T = 15 0.04139 
30 T<9 和 了 之 21 0.04277 
60 T< 21 和 T> 39 0.02734 
100 T < 39 和 T> 61 0.03520 


注意 ， 对 于 所 有 m<20 和 由 表 A3 得 到 的 值 是 相同 的 .对 于 n >20， 可 以 用 正 态 近似 
( 例 1.5.6) 的 结果 ,但 是 表 中 精确 的 结果 可 能 更 好 . 

为 了 看 检验 序列 是 否 相 合 ,我 们 来 比较 这 些 检验 的 功效 函数 . 由 Dixon( 1950) 
给 出 的 表 , 我 们 在 图 2-5 中 画 出 了 其 中 的 几 个 功效 函数 .我 们 可 以 看 到 随 着 样本 容 
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晤 的 增加 ， 对 于 每 个 固定 的 p- 值 (除了 p =0.5)， 功 效 一 直 增 大 到 1.0. 
PHE Ho) 


图 2-5 几 个 功效 函数 的 比较 E 

这 个 例子 只 是 表明 检验 序列 相合 性 背后 的 思想 ， 而 不 是 严格 地 证 明 检验 序列 是 

相合 的 .相合 性 严格 的 证 明 通 常 需要 更 多 的 数学 理论 ， 而 在 本 书 中 ， 我 们 不 涉及 这 
部 分 内 容 ， 所 以 只 是 给 出 一 检验 序列 (或 一 “检验 ”) 是 否 相合 的 结论 . 


相对 效率 


我 们 已 经 定义 了 统计 检验 的 许多 其 他 性 质 ， 相 关内 容 在 各 种 著作 中 (4, Leh- 
mann,1959) 都 可 以 找到 .我 们 再 讨论 一 个 性 质 ， 即 效率 (efficiency)， 效率 是 一 个 
相对 的 术语 ， 它 是 用 来 比较 在 相同 条 件 下 两 种 检验 的 样本 容量 . 假定 有 两 个 检验 用 
来 检验 特定 的 H, 对 已 ， 而 且 它 们 有 相同 的 w 和 有 B 值 ， 因 此 关于 显著 性 水 平和 功效 它 
们 是 “可 比 的 >. 〈 注 意 ， 两 种 检验 的 B 值 是 相等 的 ， 通 常 排 除了 备 择 假 设 是 复合 假 
设 的 情况 ， 因 为 这 时 通常 B 不 只 有 一 个 值 . ) 需要 的 样本 量 越 小 的 检验 越 好 ， 因 为 小 
样本 量 意味 着 试验 中 用 更 小 的 花费 和 更 少 的 精力 ， 较 小 的 样本 量 的 检验 被 称 为 比 其 
他 检验 更 有 效 (more efficient) ， 相 对 效率 (relative efficient) 也 更 大 . 

定义 2.4.3 设 T 和 工分 别 表示 两 种 检验 ， 用 来 检验 相同 的 H, 对 H, ie 
对 应 的 a 和 B 相 等, T, XJ T, 的 相对 效率 (或 “7T, 相对 于 也 的 效率 ") 定义 为 比值 
n/n, ÈP n, Mn, DIER T, A T, 的 样本 容量 . 

RIEN 24.3, WER n 小 于 n,，T, 相对 于 也 的 效率 比 1 大 ， 和 我 们 预想 的 一 样 . 

假如 备 择 假设 是 复合 的 ， 相 对 效率 可 以 由 备 择 假 设 定义 的 每 个 概率 函数 计算 得 
到 ， 这 些 相 对 效率 值 可 用 表格 ,或 有 时 用 图 像 来 表示 . | 
例 2. 4. 3 
在 相同 的 为 对 H, 下 ， 两 种 检验 有 相等 的 w =0.01 和 B=0.14， 第 一 个 检验 的 样本 
量 为 73， 第 二 个 为 50， 因 此 第 一 个 检验 不 如 第 二 个 检验 有 效 ， 第 一 个 检验 对 第 二 个 
检验 的 相对 效率 为 
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50 _ 
>s = 0.67 


第 二 个 检验 相对 第 一 个 检验 的 效率 为 


75 _ 
s= 15 


若 已 知 w=0.05,8 =0.30,m =40， 第 一 个 检验 相对 于 第 二 个 检验 的 效率 是 
0.75， 那 么 可 以 得 到 要 求 的 第 二 个 检验 的 样本 容量 . 


相对 效率 一 下 

_ 有 

0.75 = 40 

n = 30 
第 二 个 检验 方法 用 30 个 样本 ， 就 能 够 达到 第 一 个 检验 用 40 个 样本 得 到 的 一 样 好 的 
分 析 结果 . a 


渐 近 相对 效率 (A. R. E) 


相对 效率 依赖 于 a 的 选择 ，B 的 选择 ， 以 及 复合 假设 H, 中 的 特定 备 择 假 设 ， 为 
了 提供 一 个 检验 与 其 他 检验 进行 全 面 的 比较 ， 相 对 效率 显然 依赖 于 太 多 的 参数 .我 
们 更 希望 进行 比较 而 不 依赖 于 a,B 以 及 当 H, 是 复合 假设 时 ，H, 中 特定 备 择 假设 的 选 
择 ， 有 时 这 种 方法 可 以 简要 叙述 如 下 . 

考虑 一 检验 序列 ， 对 于 同一 固定 的 w， 假 如 检验 序列 相合 ， 那 么 随 着 样本 量 n, 
的 增加 ，B 变 小 ， 为 了 不 让 B 变 小 ， 在 每 个 不 同 的 n, ， 我 们 每 次 考虑 不 同 的 备 择 假设 
(在 复合 假设 下 ) ， 使 得 在 不 同 的 检验 中 ，B 取 某 一 常 值 ， 因 此 ， 随 着 n 的 增加 ，a 
和 8 有 8 固定 不 变 ， 所 考虑 的 备 择 假设 随 之 变化 . 

上 面 所 讲 的 可 再 用 图 2-5 表现 出 来 ， 考 虑 参数 p 连续 地 趋 近 于 p =0.5， 随 着 nn 
增 大 ， 图 2-5 中 的 B 可 以 保持 不 变 . 

在 备 择 假设 下 ， 对 于 每 个 n,， 考 虑 计算 有 相同 的 a 和 6 值 的 第 二 个 检验 的 样本 
其 n, 值 ， 那 么 对 于 原来 检验 序列 中 的 每 个 检验 ， 都 有 一 列 相对 效率 n/n E, A B 
着 n, 增 大 ，n,/n, 趋 近 于 一 个 常数 ， 且 不 随 着 a 和 有 值 的 变化 而 改变 ， 那么 该 常数 称 
为 第 一 个 检验 对 第 二 个 检验 的 渐 近 相对 效率 (asymptotic relative efficiency) ， 或 更 准 
确 些 ， 是 第 一 个 检验 序列 对 第 二 个 检验 序列 而 言 的 ， 有 时 也 称 这 样 定 义 的 渐 近 相对 
效率 为 Pitman 效率 (Pitman efficiency) , 以 区 分 其 他 定义 的 渐 近 相对 效率 . 

定义 2.4.4 “n, An, 分 别 是 在 相同 的 显著 性 水 平 下 ， 有 相同 功效 的 两 个 检验 
T, 和 了 的 样本 容量 ， 如 果 a 和 有 固定 ， 当 n, 趋 于 无 穷 时 ,极限 n/n FE, 且 与 a 
和 有 独立， WWA, n/n, 的 极限 称 为 第 一 个 检验 对 第 二 个 检验 的 渐 近 相对 效率 
(A. R. E). 

在 我 们 的 问题 中 ， 为 了 寻找 最 大 功效 的 检验 ， 通 常 要 找 出 具有 最 大 渐 近 相对 效 
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率 的 检验 ， 因 为 功效 依赖 于 太 多 因素 . 因此 一 个 检验 相对 于 另 一 个 检验 的 A. R. E 是 
很 重要 的 . 

通常 两 个 检验 的 A. R. E 计算 起 来 比较 困难 . 各 种 成 对 组 合 检验 的 A. R. E 的 全 面 
研究 本 身 就 可 以 构成 一 本 书 的 主题 . Noether (1967a ) 写 的 书 就 涵盖 了 许多 关于 
A. R. E 的 重要 的 研究 结果 . 同时 Stuart(1954 ) 与 Ruist(1955 ) 对 此 也 有 进一步 的 研究 . 

所 以 A. R. E 可 以 代替 相对 效率 表 . 但 是 ， 如 果 样 本 无 限 (从 而 不 可 能 ) ， 那 么 
如 何 用 A. R. E W? 对 于 小 样本 量 的 精确 相对 效率 的 研究 表明 ， 在 很 多 实际 应 用 中 ， 
A. R. E 可 作为 相对 效率 一 个 很 好 的 近似 ， 因此，A. R. E 简洁 地 概括 了 两 个 检验 的 相 
对 效率 . 


保守 检验 


在 讨论 一 个 检验 时 ， 我 们 有 时 还 要 考虑 它 的 保守 性 (conservative). 

定义 2. 4.5 一 个 检验 称 为 是 保守 的 ， 如 果真 实 的 显著 性 水 平 比 规定 的 显著 性 
水 平 小 . 

有 人 时， 计算 一 个 检验 的 精确 的 显著 性 水 平 是 很 困难 的 ， 这 时 要 使 用 近似 计算 a 
的 一 些 方法 ， 从 而 用 近似 值 来 作为 显著 性 水 平 . 如 果 近 似 的 显著 性 水 平 比 真 实 的 显 
著 性 水 平 (但 未 知 ) 大 ， 则 检验 是 保守 的 ， 并 且 我 们 知道 犯 第 一 类 错误 的 风险 没有 
规定 的 那么 大 . 


习题 


1， 一 枚 硬币 搓 5 次 ， 试 验 者 记录 每 一 次 投掷 的 观测 结果 ， 将 研究 对 象 的 眼睛 蒙 起 来 ， 猜 测 
硬币 落地 时 的 “状态 ”， 以 检验 他 是 否 有 超 感 知觉 ， 零 假设 为 研究 对 象 猜 对 的 概率 是 
p=0.5， 而 备 择 假设 为 p >0.5. 临界 域 为 5 次 全 部 猜 对 . 

(a) Ra. (b) 功效 函数 是 什么 ? 
(c) 画 出 功效 函数 的 图 像 . (d) 检验 是 无 偏 的 吗 ? 

2. 检验 两 种 皮鞋 中 哪 种 更 耐用 ， 制 造 8 双 皮 鞋 ， 每 双 中 除了 其 中 一 只 由 皮革 A 制 做 ， 男 一 
只 由 皮革 B 制 做 外 ， 这 8 双 鞋 一 模 一 样 ， 这 些 鞋 正常 使 用 一 段 时 间 后 ， 再 判断 哪 种 皮革 
更 耐用 . 令 X 表示 判别 得 出 A 制 成 更 耐用 鞋 的 对 数 . 零 假设 为 p =0.5， 这 里 p 为 更 耐用 
的 鞋 是 由 A 制 成 的 概率 ， 而 Hi 为 pz0. 5， 临 界 域 为 X=0,1,7 ,8. 

(a) SR o. (b) 功效 函数 是 什么 ? 
(c) 画 出 功效 函数 的 图 像 . (d) 检验 是 无 偏 的 吗 ? 

3， AT , 卫 … 表 示 一 检验 序列 ， 并 假设 T, 的 功效 P, 为 P, =n/(n+10)， 该 检验 序列 是 相合 的 吗 ? 

4. 令 7T,,T,… 表 示 一 检验 序列 ， 并 假设 T, 的 功效 为 n/(2n +10)， 该 检验 序列 是 相合 的 吗 ? 

对 于 假设 检验 H.:p =1/2,H,:p =3/4， 用 显著 性 水 平 相等 的 两 种 检验 T, 和 T, 来 检验 ， 如 

H T, 的 样本 量 是 20， 那 么 了 用 35 个 样本 时 才能 达到 和 也 一 样 的 功效 . 

(a) T, 相对 于 也 的 效率 是 多 少 ? (b) T, XF T, 的 效率 是 多 少 ? 

6. 对 于 假设 检验 :p=1/2,Hi :p 天 1/2， 用 显著 性 水 平 相等 的 两 种 检验 来 检验 ， 当 也 的 样 
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本 量 为 15 时 ， 需要 30 个 样本 ， 它 们 的 功效 隐 数 才能 在 特定 备 择 假设 p = 1⁄3 时 相等 . 
(a) T, 相对 于 T, 的 效率 是 多 少 ? 
(b) 备 择 假设 为 p=2/3 时 ， 它 们 的 效率 一 定 相 等 吗 ? 


思考 题 


I. 假设 T, 相对 于 也 的 渐 近 效率 是 0.75， 且 对 于 有 限 样 本 相对 效率 总 是 大 于 渐 近 相对 效率 . 
如 果 试 验 者 更 愿意 使 用 检验 7,， 且 希望 它 的 功效 至 少 和 样本 量 为 24 的 检验 T, 相等 ， 那 
么 检验 T, 的 最 小 样本 量 是 多 少 ? 

2. (BHT, 相对 于 了 的 A.R.E， 43/7, H T, 相对 于 也 的 A.R.E 为 2/r BË2Z T, 相对 于 
T, 的 A. R. E 是 多 少 ? 


2.5 非 参数 统计 评述 


本 节 我 们 试图 区 别 术 语 和 参数 统计 (parametric statistics) 与 非 参 数 统 计 (nonpara- 
metric statistics) ， 尽 管 对 于 专业 统计 学 家 这 些 不 同 之 处 也 不 总 是 能 区 分 得 很 清楚 . 我 们 
使 用 术语 非 参 数 的 ( nonparametric)， 更 具体 地 说 是 无 分 布 的 (distribution-free) ， 它 们 
可 以 互相 代替 ， 尽 管 一 些 统计 学 家 认为 二 者 之 间 仍 有 差别 .我 们 就 分 析 数 据 时 什么 时 候 
使 用 非 参 数 统计 ， 什 么 时 候 参 数 法 更 有 利 给 出 一 些 指 导 . 


使 用 优良 方法 


首先 我 们 讨论 假设 检验 和 置信 区 间 . 本 章 已 经 指出 假设 检验 要 基于 一 个 好 的 统 
计量 ， 它 对 零 假设 和 备 择 假 设 间 的 差别 应 是 敏感 的 ， 并 且 在 零 假设 下 它 的 概率 分 布 
已 知 ， 置 信 区 间 是 假设 检验 的 逆 推 ， 因 为 置信 区 间 是 由 数据 不 能 拒绝 的 零 假设 的 集 
合 ， 所 以 ， 一 个 好 的 〈 有 效 的 ) 假设 检验 对 应 于 一 个 好 的 〈 短 的 ) 置信 区 间 ， 反 之 
亦 然 . 

例如 ,样本 均值 了 对 于 检验 总 体 均 值 j 是 一 个 好 的 检验 统计 量 ， 因 为 它 对 总 体 
均值 的 不 同 很 敏感 ， 类似 S 和 对 于 推断 总 体 标准 差 o 是 好 的 检验 统计 量 . 但 是 ， 
X,S 和 s 的 概率 分 布 取 决 于 X 的 总 体 概率 分 布 ， 但 这 通常 是 未 知 的 . 


参数 方法 


如 果 总 体 概率 分 布 是 正 态 分 布 ， 那么 六 ,或 一 些 基于 XX 的 统计 晤 ， 可 用 于 检验 关 
Tu 的 假设 ,或 求 出 估计 的 置信 区 间 ， 因 为 零 分 布 是 已 知 的 . 同样 地 ， 如 果 分 布 
是 正 态 分 布 ， 基于 S$S 或 s 和 样本 标准 差 ， 我 们 可 以 检验 关于 总 体 标 准 差 o 的 假设 和 构 
造 og 的 置信 区 间 . 

以 上 都 称 为 参数 方法 (parametric method) ， 因 为 它们 都 是 在 已 知 总 体 分 布 函数 
时 有 效 . 任何 假设 检验 或 置信 区 间 都 是 基于 这 样 的 假设 : 总 体 分 布 函 数 已 知 或 只 带 
有 一 些 未 知 参 数 ， 这 称 为 参数 方法 . 
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但 是 我 们 如 何 才能 确定 总 体 的 概率 分 布 是 正 态 分 布 ， 或 其 他 分 布 呢 ? 答案 很 简 
单 ， 我 们 不 能 .在 基于 正 态 分 布 做 假设 检验 之 前 ,我 们 首先 能 通过 考察 数据 来 判断 
它 是 否 来 自 于 正 态 分 布 ， 或 做 一 个 考察 数据 非 正 态 性 的 假设 检验 , 

大 多 数 参 数 方法 都 基于 正 态 假 设 ， 因 为 检验 背后 的 理论 可 以 基于 和 总 体 正 态 分 布 
推出 ， 对 于 正 态 分 布 的 数据 ， 一 些 方法 和 结果 是 有 效 的 .其 他 的 参数 方法 也 是 基于 
总 体 服从 其 他 某 一 特定 分 布 ， 如 指数 分 布 ， 威 布尔 分 布 等 . 


稳健 方法 


没有 任何 一 个 总 体 是 服从 精确 的 正 态 分 布 或 其 他 任何 已 知 的 分 布 ， 假 如 总 体 分 
布 是 近似 正 态 的 ， 那 么 通常 (不 总 是 ) 基于 正 态 分 布 来 使 用 这 种 方法 是 安全 的 . 但 
是 ， 如 果 数 据 看 起 来 显然 来 自 非 正 态 分 布 ， 或 不 适用 于 参数 方法 的 分 布 ， 那么 这 时 
应 当 考 虑 非 参 数 方法 . 

尽管 一 种 分 析 数 据 的 方法 背后 的 某 个 假设 条 件 不 成 立 ,但 它 是 还 近似 有 效 的 ， 
那么 就 认为 这 种 方法 对 这 一 假设 条 件 是 稳健 的 (robust). 一般 说 来 ， 稳 健一 词 是 指 
基于 正 态 假设 的 方法 ， 而 即使 潜在 的 总 体 分 布 是 非 正 态 的 ， 检 验 统计 量 也 有 近似 相 
同 的 零 分 布 . 

一 些 参 数 检验 ， 例 如， 一 样本 :检验 或 两 样本 :检验 ,特别 是 当 样 本 量 很 大 时 ， 
对 于 正 态 假设 条 件 是 稳健 的 ， 这 就 意味 着 检验 统计 量 的 零 分 布 近似 于 正 态 总 体 所 对 
应 检验 统计 量 的 零 分 布 ， 并 且 试 验 者 可 以 将 检验 统计 量 的 值 与 总 体 是 正 态 时 的 精确 
的 上 分 布 表 对 应 起 来 ; 即使 总 体 是 非 正 态 的 ， 我 们 也 有 信心 认为 表 中 的 分 位 数 ， 能 够 
很 好 地 近似 检验 统计 量 的 真实 的 分 位 数 . 

然而 ， 正 因为 方法 是 稳健 的 ， 所 以 不 能 确保 当 总 体 是 非 正 态 时 ， 该 方法 一 定 像 正 
态 时 那么 有 效 ， 因 此 使 用 一 种 统计 方法 我 们 不 仅 要 问 ， 它 稳健 吗 ? 还 要 问 ， 它 有 效 吗 ? 
统计 方法 当然 应 该 是 稳健 的 ， 这 样 ， 使 得 到 的 显著 性 水 平 接近 真实 显著 性 水 平 ， 但 更 应 
该 是 有 效 的 ， 以 便 有 效 地 利用 和 处 理 数 据 ， 以 及 拒绝 错误 的 零 假 设 . 


非 参 数 方法 


非 参 数 方法 和 参数 方法 都 基于 一 些 共 同 的 假设 ， 如 假设 样本 是 随机 样本 ， 但 是 ， 
非 参数 方法 不 假定 特定 的 总 体 概率 分 布 ， 因 此 对 于 来 自任 何 未 知 概率 分 布 总 体 的 数 
据 ， 它 都 适用 . 

非 参数 方法 对 总 体 分 布 假设 是 非常 稳健 的 ， 因 为 它们 对 于 所 有 的 分 布 都 同样 有 效 . 

如 果 总 体 分 布 函数 比 正 态 分 布 轻 尾 ， 例 如 均匀 分 布 ， 那 么 基于 正 态 假设 的 参数 
方法 一 般 会 得 到 好 的 功效 ， 等 于 或 大 于 在 第 5 章 将 要 介绍 的 基于 秩 的 非 参数 方法 得 
到 的 功效 ， 例 如 ， 意 见 调查 数据 是 轻 尾 数据 ， 问 卷 答案 由 1 到 5 或 1 到 ?7 构成 尽管 
答案 的 分 布 是 离散 的 ， 且 可 能 是 不 对 称 的 ， 从 而 显然 是 非 正 态 的 .但 是 由 于 它 是 轻 
尾 的 ， 所 以 在 关于 总 体 均 值 的 假设 检验 中 ， 从 好 的 功效 角度 来 讲 ， 通 常 基于 正 态 的 
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参数 方法 比 非 参数 方法 更 受 欢迎 . 

另 一 方面 ， 如 果 总 体 分 布 函数 比 正 态 分 布 重 尾 ， 例 如 指数 分 布 〈 第 6 章 介绍 ) ， 
对 数 正 态 分 布 数据 的 对 数 服从 正 态 分 布 ) ， 卡 方 分 布 〈 属 于 伽 马 分 布 族 ) ， 以 及 许 
多 其 他 合理 总 体 模型 中 出 现 的 分 布 ， 那 么 基于 正 态 假设 的 参数 方法 一 般 比 基于 秩 的 
非 参数 方法 的 功效 要 低 . 

包含 离 群 值 (outlier) 的 数据 是 来 自重 尾 分 布 的 典型 数据 ， 离 群 值 的 观测 值 比 样 
本 中 其 他 的 观测 都 大 很 多 或 小 很 多 ， 在 这 种 情况 下 ， 考 虑 使 用 非 参 数 方法 来 分 析 数 
据 是 非常 重要 的 ， 例 如 第 5 章 中 所 介绍 的 秩 方法 ， 因 为 秩 方法 的 功效 比 基 于 正 态 假 
设 的 参数 方法 功效 要 高 . 


渐 近 分 布 自由 


许多 参数 检验 对 于 非 正 态 假设 条 件 是 稳健 的 ， 也 是 渐 近 分 布 自由 的 《asymptoti- 
cally distribution-free). 这 意味 着 随 着 样本 容量 的 增加 ， 方 法 变 得 更 加 稳健 ， 对 于 无 
限 样本 容量 的 情形 ,方法 是 精确 的 且 不 依赖 于 总 体 分 布 ， 通常 ， 基 于 样本 均值 渐 近 
无 分 布 的 参数 方法 的 理论 基础 是 中 心 极限 定理 . 在 2. 2 中 构造 总 体 均值 多 的 渐 近 置信 
区 间 时 ， 使 用 的 就 是 上 面 的 方法 . 

不 应 该 只 因为 一 种 统计 方法 是 非 参数 的 ， 稳 健 的 ， 或 渐 近 无 分 布 的 ， 我 们 就 更 
MEE 不论 样本 容量 是 多 少 ， 尽 管 方法 是 渐 近 分 布 自由 的 ， 参 数 检验 的 相对 功效 
或 置信 区 间 的 相对 大 小 ， 和 非 参数 方法 比 起 来 ,通常 有 好 有 坏 . 上 面 关 于 各 种 类 型 
数据 的 统计 方法 偏好 的 讨论 ， 不 论 样 本 容量 的 大 小 ， 都 是 适中 的 . 

记 住 ， 我 们 考虑 的 绝 大 多 数 方法 都 是 相合 的 ， 也 就 是 说 样本 量 的 增 大 意味 着 绝 
对 功效 的 变 高 .如果 样本 量 足够 大 ，. 使 得 用 一 功效 较 小 的 检验 也 能 够 拒绝 零 假 设 ， 
或 用 效率 较 低 的 方法 得 到 的 置信 区 间 的 长 度 ， 对 试验 者 的 要 求 来 说 已 经 足够 短 ， 那 
么 仔细 选择 功效 较 大 的 方法 就 显得 没有 必要 了 . 当然 ， 在 选择 分 析 数 据 的 统计 方法 
时 ,试验 者 还 要 考虑 许多 的 其 他 方面 


名 义 数据 的 分 析 方 法 


正如 我 们 引言 所 提 到 的 ， 大 多 数 人 想到 的 非 参数 方法 都 是 将 在 第 5 章 和 第 6 章 介 
绍 的 基于 秩 的 方法 ， 因 为 秩 方 法 是 一 些 参数 检验 的 合理 选择 ， 比 如 ， 对 具有 度量 是 
区 间或 比率 尺度 的 数据 所 进行 的 + 检验 和 方差 分 析 ， 但 是 ， 非 参数 方法 还 可 以 用 于 采 
用 名 义 或 次 序 尺 度 的 定性 数据 . 

如 果 没 处 理 过 定性 数据 ， 至 少 是 区 间 数 据 ， 那 么 很 难 想象 名 义 或 次 序数 据 的 
总 体 概率 分 布 的 定义 ， 所 以 ,没有 参数 方法 适用 于 纯粹 的 名 义 或 次 序数 据 ， 分析 
定性 (名义 ) 数据 或 仅仅 已 知 次 序 或 秩 的 数据 ， 只 能 采用 非 参 数 方法 .第 3 章 和 第 
4 章 将 介绍 分 析 定性 数据 的 方法 ， 第 5 章 和 第 6 章 的 大 多 数 方法 更 适合 于 分 析 次 序 
数据 . 
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非 参 数 的 定义 


我 们 给 出 如 下 非 参 数 的 定义 ， 它 似乎 比较 有 效 . 

定义 2.5.1 一 种 统计 方法 称 为 非 参 数 的 ， 如 果 它 至 少 满足 下 面 的 法 则 之 一 : 

1. 该 方法 适用 于 分 析 名 义 尺度 数据 . 

2. 该 方法 适用 于 分 析 次 序 尺 度数 据 . 

3. 该 方法 适用 于 分 析 区 间或 比率 尺度 数据 ， 这 里 除了 有 无 限 多 个 未 知 参数 外 ， 

由 随机 变量 分 布 函 数 所 产生 的 数据 ， 要 么 是 非特 定 的 ， 要 么 是 特定 的 . 

例 2.3.1 中 检验 的 数据 是 名 义 数 据 〈 次 品 或 非 次 品 ) ， 所 以 由 上 面 定 义 中 的 第 一 
个 法 则 ， 该 检验 是 非 参数 的 . 例 2. 3. 1 中 检验 的 数据 是 次 序数 据 ， 因 此 由 第 2 条 法 则 
它 也 是 非 参 数 的 ， 几 乎 所 有 的 非 参数 假设 检验 都 满足 这 两 条 法 则 之 一 2.2 节 中 的 点 
估计 满足 第 3 个 法 则 ， 并 且 在 5.7,5. 10 和 5. 11 节 中 基于 对 称 分 布 的 方法 也 满足 第 3 
个 法 则 ， 因 此 ， 我 们 认为 它们 是 非 参 数 的 . 

本 书 主要 讨论 的 是 假设 检验 和 构造 置信 区 间 . 不 幸 的 是 ， 这 经 常 给 试验 者 一 种 
错觉 ， 他 们 如 果 不 做 假设 检验 或 构造 置信 区 间 ， 就 好 像 不 是 在 做 统计 分 析 ， 其 他 形 
式 的 统计 分 析 也 同样 重要 ， 例 如 总 体 的 描述 性 ， 数 据 的 解释 ， 未知 事件 的 预测 以 及 
点 估计 等 . 

这 些 其 他 形式 的 推断 很 大 程度 上 依赖 于 试验 者 的 经 验 和 良好 的 判断 力 ， 而 不 是 
复杂 的 概率 论证 ; 所 以 我 们 认为 它们 太 难 ， 而 不 在 本 书 中 不 加 以 讨论 ， 我 们 只 把 与 
假设 检验 和 置信 人 区间 有 关 的 一 些 复杂 概率 论证 阐述 清楚 ， 以 帮助 那些 已 经 具备 足够 
经 验 和 良好 判断 力 的 试验 者 . 

解决 其 他 几 类 问题 的 已 有 非 参 数 统计 方法 在 本 书 中 没有 涉及 ， 这 些 领 域 (和 读者 
感 兴趣 的 某 些 参 考 文献 ) 包括 生物 鉴定 (Miller,1973 ,Chmiel,1976) ， 生 存 曲线 ( Susar- 
la 和 Van Ryzin ,1976 ,Tarone 和 Ware ,1977) 和 纵向 数据 研究 (Ghosh, Grizzle 和 Sen, 
1973)， Aitchison 和 Aitken(1976) ， 与 Bhapkar 和 Patterson(1977 ) 讨论 了 多 元 方法 ， 这 
也 是 Puri 和 Sen(1971 ) 书 中 所 讨论 的 主题 . 对 于 识别 分 析 可 参见 Gessaman 和 Gessaman 
(1972) ,Broffitt, Randles 和 Hogg(1976) ，Randles，Broffitt ，Ramberg 和 Hogg( 1978 ) ,与 
Conover 和 Iman( 1980). 

稳健 方法 在 一 定 程度 上 依赖 于 总 体 分 布 函 数 ， 但 对 于 偏离 假设 分 布 形式 不 是 很 
敏感 .5. 12 节 中 简要 地 讨论 了 稳健 方法 . 更 完整 的 讨论 可 在 Govindarajulu 和 Leslie 
(1972) ,Hogg( 1974) ,Pearson 和 Please( 1975 ) ,Policello 和 Hettmansperger( 1976 ) 以 及 
5.12 节 所 引入 一 些 参考 文献 中 找到 ， 非 参数 统计 领域 的 概况 介绍 可 见 Kendall 与 Sun- 
drum( 1953) ,Blum 与 Fattu( 1954) , Savage ( 1969 ) , Bell ( 1964 ) 和 Govindarajulu ( 1976 ) 
的 相关 文章 或 Tate( 1957) ,Fraser( 1957) , Walsh ( 1962) , Noether ( 1967) ,Pierce( 1970) ， 
Hollander 和 Wolfe ( 1973 ) , Tapia ( 1978 ) , Randles ( 1979 ) , Buringer ( 1980 ) , Henley 
(1981) ,Pratt( 1981) 以 及 Manoukin( 1986 ) 的 相关 著作 . 
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2.6 第 2 章 复 习题 


盒子 里 装 有 7 张 票 ，5 张 是 学 生 票 ， 另 外 2 张 是 教师 票 ， 从 盒子 中 无 放 回 地 抽取 2 张 票 ， 

来 确定 两 名 胜利 者 零 假设 是 随机 抽取 ， 备 择 假 设 是 作弊 抽取 ， 使 得 第 一 张 票 是 教师 票 ， 

第 二 张 票 从 剩 下 的 6 票 中 随机 抽取 . 

(a) 假设 判决 准则 是 若 所 有 的 票 都 是 教师 的 ， 则 拒绝 零 假 设 、 求 a 和 功效 . 

(b) 假设 判决 准则 是 若 第 一 张 票 是 教师 票 ， 则 拒绝 零 假 设 ， 求 a 和 功效 . 

(c) 一 些 人 偏爱 (a) 中 的 检验 ， 因 为 它 有 较 小 的 显著 性 水 平 . 另外 一 些 人 偏爱 (b) 中 
的 检验 ， 因 为 它 有 较 大 的 功效 ， 讨 论 每 种 检验 的 社会 影响 ， 你 希望 用 哪 种 检验 ? 

下 面 各 随机 变量 的 度量 尺度 是 什么 ? 

(a) 对 某 膳食 ， 体 重 增加 (或 减少 ) 的 磅 数 . 

(b) 堪萨斯 皇家 队 在 职业 棒球 联赛 中 的 排名 . 

(c) 学 生 的 学 号 . 

(d) 某 篮球 运动 员 的 平均 得 分 . 

(e) 奥运 会 比赛 中 某 花 样 滑冰 运动 员 的 得 分 . 

两 名 学 生 通 过 下 棋 来 比试 . 法 则 为 进行 7 局 比赛 ， 平 局 不 算 ， 如 果 一 人 至 少 赢 了 6 局 ， 那 

么 就 认为 他 们 的 棋 力 不 在 同一 档次 . 


(a) 是 什么 ? (b) H, 是 什么 ? 

(c) 写 出 样本 空间 中 任意 一 点 . (d) 列举 临界 域 中 所 有 的 样本 点 . 
(e) 求 出 显著 性 水 平 . (f) H, 是 简单 假设 还 是 复合 假设 ? 
(g) H, 是 简单 假设 还 是 复合 假设 ? (h) 功效 函数 的 方程 式 是 什么 ? 

(i) 检验 是 无 偏 的 吗 ? (j) 这 里 你 会 做 出 什么 假定 ? 


客人 离开 后 ， 和 餐馆 经 理 将 客人 的 支票 放 到 收银 机 中 ， 随 后 ， 审 计 员 核查 经 理 的 工作 ， 他 
RMA 12 个 错误 ， 其 中 10 个 错误 对 客人 有 利 ， 而 2 个 错误 对 经 理 有 利 ， 令 零 假 设 为 经 理 
犯 的 错误 对 自己 和 客人 有 利 的 概率 相等 ， 而 备 择 假设 是 经 理 犯 的 错误 对 自己 和 客人 有 利 
的 可 能 性 不 等 . 

设 临 界 域 为 对 客人 有 利 的 错误 大 于 等 于 10 个， 或 对 经 理 有 利 的 错误 大 于 等 于 10 个 . 

(a) 求 出 该 检验 的 显著 性 水 平 a 

(b) 如 果 经 理 犯错 误 对 客人 有 利 的 概率 是 对 自己 有 利 概率 的 3 倍 ， 求 检验 的 功效 

(c) 画 出 功效 曲线 的 图 像 ， 该 检验 是 无 偏 的 吗 ? 加 以 解释 说 明 . 

汽车 生产 流水 线 的 最 后 阶段 会 有 12% 的 车 辆 不 能 通过 检查 ， 需 要 加 以 特别 处 理 . 设 X 为 
每 4 辆 中 不 能 通过 检查 的 汽车 数量 ， 假 设 汽车 能 和 否 通 过 检查 是 相互 独立 的 . 


(a) 求 X 的 均值 和 标准 差 . (b) 求 X 的 中 位 数 和 四 分 位 极 差 . 
继续 题 $S， 生 产 6 组 汽车 ， 每 组 4 辆 ， 在 生产 线 最 后 阶段 每 组 车 中 没 通过 检查 的 数量 分 别 
为 0,0,0,1 ,1 ,2. 


(a) 求 样本 均值 和 标准 差 . 
(b) 求 样 本 中 位 数 和 四 分 位 极 差 . 
(c) 由 数据 估计 一 辆 汽车 不 能 通过 检查 的 概率 . 
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讨论 习题 5 中 的 度量 尺度 . 
(a) 每 辆 车 的 度量 尺度 是 什么 ? (b) X 的 度量 尺度 是 什么 ? 
得 克 萨 斯 州 的 所 有 家 庭 中 ，20% 没 有 车 ，30% 有 1 辆 车 ，30% 有 2 辆 车 ，10% 有 3 辆 车 ， 
剩 下 的 超过 3 辆 车 ， 随 机 抽取 10 个 家 庭 ， 结果 如 下 : 没有 车 的 家 庭 是 3 个 ， 有 1 辆 车 的 
家 庭 2 个， 有 2 辆 车 的 家 庭 2 个 ， 有 3 辆 车 的 家 庭 1 个 ， 有 4 辆 车 的 家 庭 1 个 ， 有 5 辆 车 
的 家 庭 1 个 . 
(a) 求 每 个 家 庭 车 辆 拥有 量 的 总 体 中 位 数 . (b) 求 总 体 四 分 位 极 差 . 
(c) 讨论 在 这 个 问题 中 为 什么 用 总 体 中 位 数 比 总 体 均值 要 好 . 
(d) 求 每 个 家 庭 拥有 车 数 的 样本 中 位 数 . (e) 求 车 数 的 样本 均值 . 
(f) 求 样 本 标准 差 ， 用 S 而 不 是 s. (g) 画 出 总 体 分 布 函 数 图 像 . 
(h) 画 出 经 验 分 布 函 数 图 像 . 
令 义 为 上 下 班 高 峰 期 城市 快速 路 上 任 一 辆 机 动车 中 的 人 数 .，X 的 概率 为 P(X=1) =0. 40， 
P(X=2) =0.30,P(X=3) =0.20 及 P(X=4) =0.10. 和 的 一 组 随机 样本 中 有 10 个 观测 
值 ， 如 下 所 示 : 

4 L oe. 4 O s: £: 3 
求 样本 均值 ， 画 出 经 验 分 布 函 数 图 像 〈 见 定义 2.2.1). 求 样 本 四 分 位 极 差 . 将 这 些 值 分 
别 与 总 体 均值 ， 分 布 函数 〈 见 定义 1.3.4) 和 总 体 四 分 位 极 差 进行 比较 . 


， 厦 零 假设 成 立 ， 那 么 每 位 顾客 选择 红 盒 麦片 或 蓝 盒 麦 片 的 可 能 性 相等 。 若 备 择 假设 成 立 ， 


顾客 喜欢 挑选 蓝 盒 与 红 盒 的 比例 为 3 Ik 1. 假设 每 位 顾客 挑选 盒 装 麦片 是 独立 的 . 如 果 最 
初 的 20 个 顾客 中 不 少 于 15 个 人 选择 蓝 盒 ， 那 么 拒绝 零 假设 . 求 显著 性 水 平 ， 求 功效 ， 如 
果实 际 上 观测 最 初 的 20 个 顾客 中 有 17 个 人 选择 蓝 盒 ， 求 p 值 . 


. 7 个 男生 应 征 3 个 夏令 营 辅 导 员 职位 根据 身高 将 学 生 由 高 到 低 排序 ， 分 别 用 1 (最 高 ) 


到 7 (最 低 ) 表示 ， 零 假设 为 每 名 学 生 被 选中 的 概率 相等 ， 备 择 假设 是 3 名 身高 较 高 的 学 
生 被 选中 的 可 能 性 是 4 名 身高 较 矮 学 生 的 2 倍 ， 假 设 每 个 学 生 是 否 被 选中 相互 独立 .检验 
统计 量 是 被 选中 的 3 名 学 生 身 高 排序 的 秩 和 ， 判 决 法 则 是 车 检验 统计 量 小 于 等 于 6， 则 拒 
绝 零 假设 . 

(a) 零 假 设 是 简单 假设 还 是 复合 假设 ? 

(b) 求 显 著 性 水 平 . (c) 求 检验 的 功效 . 


.一 种 基因 理论 认为 某 两 只 狗 的 后 代为 斑点 狗 的 概率 为 25% ， 令 此 为 零 假设 . 另 一 理论 则 


认为 每 只 小 狗 有 斑点 的 概率 为 75% ， 令 此 为 备 择 假设 . 一 窝 小 狗 出 生 了 ，8 只 中 有 5 只 是 

带 斑点 的 小 狗 ， 

(a) 用 目标 显著 性 水 平 0. 05 来 求 出 一 保守 检验 的 临界 域 . 

(b) 在 你 的 检验 中 ,精确 显 著 性 水 平 值 是 多 少 ? (采用 精确 的 公式 ， 正 态 允 近 计算 得 到 两 
个 稍微 不 同 的 结果 ) 

(c) 在 你 的 检验 中 ， 精 确 的 功效 是 多 少 ?( 使 用 表格 计算 出 答案 ) 

(d) 这 种 情况 下 ，p- 值 是 多 少 ? 

(e) 该 检验 是 无 偏 的 吗 ? 请 解释 . 

(f) 备 择 假设 是 简单 假设 还 是 复合 假设 ? 

撞 一 枚 非 均匀 硬币 “正面 ”出 现 的 概率 为 2/3,“ 反 面 ” 出 现 的 概率 为 1X3.， 该 硬币 掷 10 
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次 ， 结 果 出 现 5 次 “正面 ", 5 次 “反面 "， 设 X 为 “正面 ”出 现 的 次 数 . 
(a) 画 出 怀 的 总 体 分 布 函数 . (b) 求 出 总 体 中 位 数 . 
(c) 画 出 大 的 经 验 分 布 函数 , (d) 求 出 样本 中 位 数 . 


， 一 个 学 生 做 3 道 多 项 选择 题 ， 每 道 题 有 5 个 可 能 答案 ， 如 果 他 学 过 该 课程 ， 就 有 超过 


80% 的 可 能 性 答对 每 道 题 ， 如果 他 没 学 过 该 课程 〈 零 假设 ) ， 则 每 道 题 他 选择 任 一 答案 的 
概率 相等 ， 若 他 3 道 题 全 部 答对 ， 拒 绝 零 假设 . 

(a) 求 出 显著 性 水 平 . (b) 求 出 检验 的 功效 . 

(c) 还 要 做 出 哪些 题目 中 没有 明确 提出 的 假定 ? 
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Ill! 


导 


在 第 1 章 中 ,我们 介绍 了 用 二 项 分 布 来 描述 半 次 掷 硬 币 试验 中 正面 出 现 次 数 的 概 
率 ， 在 更 一 般 的 形式 为 n 次 独立 基本 试验 中 的 每 一 次 结果 ,或 以 概率 为 p“ 成 功 ”， 
RUR q =1-p “RK”. 二 项 分 布 描述 了 n 次 试验 中 恰 有 次 成 功 的 概率 、 表 A3 
给 出 了 一 些 二 项 分 布 函 数 ， 

应 用 科学 中 的 许多 试验 都 可 以 用 这 种 方法 来 建 模 ， 例 如 ， 一些 顾客 到 达 商 店 ， 
自主 地 决定 买 或 不 买 某 种 商品 ; 给 动物 用 某 种 药物 ， 它 们 治愈 或 没有 治愈 . 这 种 
例子 几乎 可 以 在 任何 领域 中 找到 ， 我 们 就 可 以 用 一 些 熟知 的 基于 二 项 分 布 的 ， 最 
简单 的 统计 方法 来 分 析 这 些 情况 下 所 获得 的 数据 ， 本 章 我 们 将 给 出 几 个 可 行 的 方 
法 ， 而 另外 章节 将 围绕 基于 二 项 分 布 的 其 他 方法 展开 .学 习 了 本 章 所 给 的 各 种 检 
验 后 ， 读 者 应 当 能 够 变通 所 学 的 方法 ， 使 之 适用 于 所 给 的 试验 情形 . 


3.1 二 项 检验 与 p 的 估计 


我 们 已 经 给 出 过 二 项 检验 的 一 个 例子 ， 例 2. 3. 1 把 二 项 检验 用 于 质量 控制 问题 . 
本 章 则 介绍 比例 2. 3. 1 更 多 的 内 容 ， 说 明 简单 二 项 检验 的 多 种 用 法 和 奇妙 变化 ， 只 要 
灵活 运用 得 好 ， 二 项 检验 可 用 来 检验 几乎 所 有 的 假设 和 所 有 类 型 的 统计 数据 分 析 . 
在 有 些 场合 ， 二 项 检验 是 最 有 效 的 检验 ， 这 时 检验 是 用 参数 和 非 参数 统计 来 要 求 的 ， 
而 在 另外 一 些 场合 ， 二 项 检验 是 比较 有 效 的 ， 我 们 只 能 用 非 参数 统计 来 要 求 ， 然 而 ， 
即使 是 在 比较 有 效 的 情形 下 ， 人 们 也 更 愿意 选用 二 项 检验 ， 因 为 它 操作 简单 ， 易 于 
解释 ， 有 时 它 有 足够 的 有 效 性 ， 使 得 在 零 假 设 应 该 拒绝 时 足以 拒绝 原 假设 . 

我 们 现在 正式 介绍 二 项 检验 ， 并 同时 介绍 二 项 检验 的 格式 ， 为 了 使 读者 方便 和 
非 参 数 方法 使 用 者 容易 掌握 ， 我 们 觉得 叙述 一 下 检验 的 格式 是 有 必要 的 . 


> 二 项 检验 


数据 ”样本 中 包含 n 次 独立 基本 试验 的 结果 ， 每 个 结果 或 者 是 “类 1” 或 者 是 “类 2”， 
但 两 类 不 能 同时 出 现 ， 类 1 的 观测 数 是 0, ， 类 2 的 观测 数 是 O, =n - O,. 


1. 第 3 章 的 复习 题 包括 在 第 4 章 的 复习 题 中 . 
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假定 条 件 

l. nn 次 基本 试验 相互 独立 . 

2. 每 次 基本 试验 中 结果 “类 1” 出 现 的 概率 是 p， 且 对 所 有 n 次 基本 试验 有 相同 的 p. 
检验 统计 量 ”由 于 我 们 关注 的 是 结果 “类 1” 出 现 的 概率 ， 我 们 令 检 验 统计 量 了 是 结 
果 为 “类 1” 的 次 数 ， 即 

T=0; (1) 
零 分 布 

令 p* 是 零 假设 中 给 定 的 概率 T 的 零 分 布 是 参数 为 p = p` ,n= 样本 容量 的 二 项 
分 布 ， 对 于 n<20 和 选 定 的 p 值 ， 表 A3 中 列 出 了 了 的 零 分 布 . 

对 其 他 的 值 和 p 值 ， 我 们 可 以 用 正 态 分 布 近似 ， 即 了 的 gq 分 位 数 x 可 以 由 下 
式 近 似 给 出 

x= n:p+z Vn.p.(l—p) (2) 


其 中 ，z, 是 标准 正 态 随机 变量 的 q 分 位 数 ， 见 表 Al. 
假设 令 p" 是 某 个 给 定 的 概率 , 0<p”<1, 假设 可 以 是 下 列 3 种 形式 之 一 . 
A. (双边 检验 ) 

Ho: p = p* 

Hı: p # p* 
理想 水 平 a 的 拒绝 域 对 应 于 T 零 分 布 的 两 边 ， 其 中 左边 水 平 为 a, ， 它 近似 于 a/2， 碳 
边 水 平 为 ， 也 是 近似 于 a/2， 其 真实 的 显著 水 平 是 a, +a, HT TB BE, 2 
一 真实 显著 水 平 很 少 为 a. 

因此 ， 对 给 定 的 特殊 p A n I, RIAR A3 中 找到 1, ， 使 得 
P(Y<ti) =o) (3) 

并 找到 t, ， 使 得 

P(YSh)=1 -a (4) 
其 中 ，Y 是 参数 为 P 和 闫 的 二 项 随机 变量 . 

如 果 站 >20， 我 们 用 正 态 分 布 逼 近 ， 即 用 (2) 式 去 近似 t,t,， 其 中 t,t 分 别 是 
参数 为 p* 和 的 二 项 随机 变量 的 a/2 分 位 数 和 (1 - ao/2) 分 位 数 ， 只 要 在 (2) 式 
中 分 别 令 9 = a/2 Mq = 1 - a/2 即 可 . 

如 果 TSi 或 Tt,， 则 拒绝 H,, BURR R iz. 

p-ti (RER) 是 两 概率 P (Y 小 于 或 等 于 观测 值 T) MP (Y 大 于 或 等 于 观测 值 
T) 中 较 小 的 一 个 的 2 倍 ， 对 于 mn<20,p =p”,p- 值 可 以 从 表 A3 中 获得 ; 对 于 n>20， 可 
利用 表 Al 和 如 下 近似 公式 获得 


P(Y <S ta) = P (z 


一 fobs 一 站 了 225) (5) 


Vn: p*( — p”) 
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(6) 


P(Y > kas) =1 — P (| 05) 


vapi =p") 
其 中 ， 引 入 0.5 EFIE -mon ESA E”. 
B. ( 左 单 边 检 验 ) 
Ho: p 2 p* 
Hi: p< p* 
由 于 小 的 工 值 预示 着 H, 是 假 的 ， 于 是 水 平 为 a 的 拒绝 域 是 17 : T<: ， 其 中 上 
由 表 A3 获得 ， 参 数 取 为 An. 所 以 
P(Y<p =a (7) 
Et, Y 是 参数 为 p”" 和 nn 的 二 项 随机 变量 . 
如 果 n >20， 我们 就 用 正 态 允 近 ， 即 用 (2) 式 去 近似 +:， 其 中 1 是 以 参数 为 p” 和 
n 的 二 项 随机 变量 的 a 分 位 点 ， 只 要 在 (2) 式 中 令 g =a 即 可 . 
如 果 T< r, ME H,， 否 则 接受 零 假 设 . 
P- 值 是 概率 P (Y 小 于 或 等 于 观测 值 T)， 当 n<20,p =p" 时 , 它 可 从 表 A3 中 获 
得 ， 如 果 n >20， 可 利用 表 Al 和 如 下 近似 公式 获得 
tos — np*+0.5 
P(Y < tos) = P kar =a 
其 中 ， 引 入 0.5 EFA -mam iE25 iB ir BJ EEE”. 
C. (fi 383936) 


(8) 


Ho: p< p* 
Hi: p> p* 
因为 大 的 了 值 预示 着 H, 是 假 的 ， 于 是 水 平 为 a 的 拒绝 域 是 17 : T>:|, HP r 
由 表 A3 获得 ， 参 数 取 为 p” 和 nn， 所 以 
Pl(Y<t{t)=1-—-a (9) 
其 中 ，Y 是 参数 为 p” 和 nn 的 二 项 随机 变量 . 
如 果 n >20， 我们 就 用 正 态 逼近 ， 即 用 (2) 式 去 近似 :， 其 中 1 是 以 参数 为 p” 和 
n 的 二 项 随机 变量 的 1 -a 分 位 点 ， 只 要 在 (2) 式 中 令 g=1-a 即 可 . 
如 果 T>t， 则 拒绝  ， 否 则 接受 零 假 设 . 
P- 值 是 概率 P (Y 大 于 或 等 于 观测 值 T)， 当 n<20,p =p" 时 , 它 可 从 表 A3 中 获 
得 ， 如 果 n>20， 可 利用 表 Al 和 如 下 近似 公式 获得 
tbs — nn-p*—0.5 
| a 
其 中 ， 引 入 0.5 REA -mam IE25 EAA ERE”. 
计算 机 辅助 ”一些 计算 机 软件 包 可 以 进行 这 种 检验 并 给 出 p- 值 ， 包 括 Minitab, 
S-Plus% StatXact. Minitab 也 可 以 计算 出 功效 ， 以 及 达到 要 求 功 效 水 平 而 所 需 的 样 


P(Y > tos) =1 — P (z< 
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F PJ |; —— sts 
例 3. 1.1 

据 估计 ， 目 前 做 前 列 腺 癌 手 术 的 男性 中 有 一 半 正 遭受 某 种 副作用 的 影响 为 了 努力 
减轻 这 种 副作用 的 可 能 性 ，FDA 研究 了 一 种 新 的 手术 六 法 ， 19 例 受 手术 者 只 有 3 人 
有 这 种 不 良 副 作用 ， 由 此 得 出 这 项 新 手术 方法 能 有 效 减 轻 副 作用 ， 这 个 结论 会 可 
靠 吗 ? 

令 p 为 患者 遭受 副作用 影响 的 概率 ， 这 是 一 个 左 单 边 检验 ，H,: p>0.5 对 
Hi:p<0.5， 如 果 目 标 值 a 是 0.05,， 那么 拒绝 域 是 |T:T<5|, 而 实际 上 a= 
0.0318 ( 见 表 A3,n=19,p=0.5). 

观测 值 了 为 3， 所 以 拒绝 万 ,， 得 出 新 方法 在 降低 副作用 可 能 性 方面 有 效 ， 其 p- 
值 为 

P(T< 3) = 0.0022 
它 很 小 ， 表 示 样 本 数据 强烈 地 拒绝 零 假设 . i 

当 精 确 的 方法 可 行 时 ， 人 们 总 是 用 精确 的 方法 ， 但 为 了 解释 正 态 逼 近 如 何 好 ， 

我 们 考虑 例 3. 1. 1， 从 (2) 式 中 可 以 得 到 近似 的 0.05 分 位 点 ， 
Xogos = 19(0.5) + (一 1.6449) V19(0.5)(0.5) = 5.9 


得 到 了 与 前 面相 同 的 拒绝 域 . 从 (5) 式 我 们 可 获得 精确 a 值 的 估计 
5 — 19(0.5) + 0.5) _ 
por<5=p(z< AO ) 0.033 
它 很 接近 于 a 的 精确 值 0.032.， 精确 的 p- 值 也 可 以 由 (5) 式 估计 


3 — 19(0.5) + 0.5 

p<3)=P(2 < sss) = 0.003 
同样 ， 它 与 真实 的 p- 值 0. 002 也 很 接近 . 
例 3. 1.2 
在 简单 的 孟 德尔 遗传 试验 中 ,将 两 种 特殊 基因 类 型 的 植物 进行 杂交 ， 产 生 的 后 代 
中 ,可 能 有 1/4 R: “kE” W, 3⁄4 是 “高 ”型 的 ， 在 一 项 验证 某 条 件 下 简单 孟 德 尔 
遗传 假设 是 否 成 立 的 试验 中 ， 杂 交 后 代 中 有 243 个 矮 植物 和 682 个 高 植物 .如果 
“类 1” 代表 “高 ", 那么 p”=3/4， 则 工 等 于 高 植物 的 个 数 . 孟 德 尔 遗 传 规律 的 零 
假设 等 价 于 假设 模型 ， 即 

Ho: p = 3⁄4 
感 兴趣 的 备 择 假设 是 双边 的 ， 即 

Hi:p# 3/4 
因为 n=243 +682 =925， 那 么 水 平 a =0.05 的 拒绝 域 可 以 通过 (2) 式 所 给 的 大 样 
本 通 近 得 到 ， 所 以 ， 拒 绝 域 为 IT: Tst UIT:T>fn}, KP 
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ti = np* + Zoms V np*(1 — p*) 
= (925)() + (1.960) V (925G) 


= 667.94 (11) 
t; = np* + zo975 V np*(1 — p*) 
= (925X) + (1.960) V (925G) = 719.56 (12) 


此 试验 中 的 T 了 值 为 682， 所 以 接受 零 假 设 . 

pP- 值 可 由 (5) 式 计 算得 出 

PY <682) = P (z <62- 2510 

其 中 ，Z 是 标准 正 态 分 布 ， 其 概率 可 在 表 Al 中 查 到 ， 这 个 单 边 检验 p- 值 的 2 倍 就 
是 双边 检验 的 p- 值 0. 392. 

显著 水 平 至 少 在 0.392 时 才 可 能 拒绝 H,， 所 以 数据 与 零 假设 吻合 得 较 好 . m 

前 面 的 例子 解释 了 双边 形式 的 二 项 检验 ， 单 边 二 项 检验 在 例 2.3. 1 中 已 经 给 
了 解释 . 
口 理论 ”通过 比较 二 项 检验 中 的 假设 ， 以 及 例 1.3.5 和 例 1.2.8 中 的 假设 ,我 们 很 容 
易 看 出 ， 二 项 检验 中 的 检验 统计 量 是 二 项 分 布 的 ， 即 如 果 了 等 于 基本 试验 结果 中 
“类 1” 的 个 数 ， 其 中 基本 试验 是 相互 独立 的 ， 且 每 次 基本 试验 得 “类 1” 结果 的 概 
率 为 p (MBRR), WA TRAZA p, 半 的 二 项 分 布 ， 在 零 假 设 成 立时 ， 
拒绝 域 的 大 小 在 p 等 于 p* 时 达到 最 大 .， 所 以 对 于 参数 n 和 p”， 表 A3 可 用 来 确定 a 
的 精确 值 . 口 

正如 前 面 提 到 的 ， 假 设 检验 只 是 统计 推断 中 的 一 个 分 支 ， 现 在 我 们 来 讨论 另外 一 
个 分 支 ， 即 区 间 估 计 (interval estimation)， 如 果 我 们 想 对 某 个 总 体 的 一 个 未 知 参数 做 
出 某 些 推断 ， 合 理 的 做 法 是 抽查 这 个 总 体 中 的 一 个 随机 样本 ， 并 且 基 于 这 个 样本 得 出 有 
关 这 个 总 体 参数 的 一 些 论断 ， 这 种 推断 可 能 是 “总 体 参 数 在 a 和 4 之 间 ”, Hp a # b 
是 由 样本 得 到 的 两 个 实数 .由 于 a 和 4b 是 由 样本 值 计 算得 出 的 ， 因 而 是 两 个 统计 量 的 实 
现 值 . 这 两 个 统计 量 提供 了 区 间 的 左 端点 和 右 端 点 ， 我 们 分 别 用 工 和 忆 表 示 ， 代表 
“ 左 ” 和 “ 右 *”， 从 工 到 上 U 的 区 间 称 为 区 间 估 计量 (interval estimator)， 总 体 未 知 参数 
落 在 此 区 间 内 的 概率 称 为 置信 系数 (confidence coefficient)， 区 间 估 计量 和 置信 系数 给 
我 们 提供 了 置信 区 间 (confidence interval). 

对 一 个 特定 事件 发 生 的 概率 未知 ， 其 寻找 户 的 置信 区 间 方 法 与 二 项 检验 密切 相关 , 


和 概率 或 总 体 比例 的 置信 区 间 


数据 ”察看 含有 n 个 独立 基本 试验 观测 值 的 样本 ， 并 记 Y 为 指定 事件 发 生 的 次 数 . 
假定 条 件 
L. n 次 基本 试验 互相 独立 . 


) = P(Z < —0.8542) = 0.196 (13) 
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2. 从 一 个 基本 试验 到 另 一 个 基本 试验 ， 指 定 事件 发 生 的 概率 p 是 常数 . 
方法 A 对 于 n<30, 利用 表 A4, 置信 系数 是 0.90,0.95 sk 0.99. 只 须 给 出 样本 
值 n 和 观测 值 Y， 我们 利用 该 表 ， 在 对 应 栏 里 的 交叉 处 ， 给 出 了 所 需 置 信和 区间 的 
左 、 右 限 . 
方法 B 对 于 n>30, 或 置信 系数 没有 在 表 A4 中 列 出 的 ， 用 下 列 正 态 分 布 晕 近 


L=*- HV — Y Ym (14) 
和 
U=Ž + z-a VY — Y)/n? (15) 


其 中 ，z 是正 态 随机 变量 的 分 位 数 ， 它 可 从 表 Al 中 查 出 ， 其 置信 系数 近似 于 1 - o. 
计算 机 辅助 ”计算 机 软件 包 可 以 算出 二 项 参数 p (或 总 体 比例 p) 的 置信 区 间 ， 这 些 
软件 包 包 括 Minitab ,S-plus 以 及 StatXact， 一 一 一 一 一 一 一 一 一 一 一 一 一 < 

为 了 表达 更 清楚 ， 在 下 面 例子 中 将 使 用 两 种 方法 来 计算 置信 区 间 . 
例 3. 1.3 
在 某 个 州 随 机 选择 20 所 高 中 ,来 检查 它们 是 否 达到 国家 教委 提出 的 优秀 标准 调 
查 发 现 有 7 所 学 校 达到 优秀 ， 并 且 因 此 被 评 为 “优秀 ”， 那 么 该 州 所 有 高 中 符合 评 
为 “优秀 ”比例 p 的 95% 置信 区 间 是 什么 ? 

首先 ， 我 们 假设 该 州 高 中 的 数量 足够 多 ,使 得 高 中 被 评 为 “优秀 ”和 “不 优 
秀 ” 是 相互 独立 的 . 

因为 我 们 假设 抽取 是 随机 的 ， 那么 对 于 所 有 学 校 p 是 相同 的 ， 它 代表 一 个 随机 
被 抽 到 的 学 校 被 评 为 “优秀 ”的 概率 . 

因为 n=20,Y=7， 我们 可 以 利用 表 A4， 由 表 A4 给 出 的 精确 95% 置信 区 间 是 
[0. 154 ,0. 592 ] . 

方法 B， 用 基于 中 心 极 限定 理 的 正 态 分 布 通 近 ， 可 得 : 


bs = —z09%75 VY (n — Y) / n° = 0.35 ~ (1.960) V(7)(13) / (20) 


= 0.35 — 0.209 = 0.141 (16) 
和 
U = 0.35 + 0.209 = 0.559 (17) 
由 正 态 分 布 逼 近 得 到 的 置信 区 间 是 【0. 141 ,0. 559] ， 它 接近 于 精确 区 间 ， 但 是 
仍 能 看 出 它们 的 差距 ， 这 表明 用 精确 置信 区 间 的 好 处 是 显然 的 . m 


口 理论 ”对 于 上 面 介 绍 的 精确 方法 A， 如 果 用 双边 二 项 检验 ， 置 信 区 间 包 括 所 有 p` 
值 ， 使 得 从 样本 中 获得 的 数据 能 够 接受 

Ho: p = p* 
更 确切 地 说 ， 如 果 我 们 想 形成 一 个 (1 -a) 的 置信 区 间 ， 就 需要 观察 样本 并 确定 Y， 
那么 我 们 要 问 “ 对 于 给 定 的 Y， 我 们 用 什么 产 值 ， 对 于 假设 


[131] 
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Ho: p = p* 
使 得 一 个 双边 二 项 检验 (a 水 平 ) 可 以 接受 及 ?”， 即 这 些 p” 值 应 当 在 我 们 的 置信 区 间 
中 ， 而 使 拒绝 H, 的 p 值 应 当 不 在 园 信 区 间 中 . 由 于 二 项 检验 的 每 一 边 有 概率 a/2， 对 
给 定 的 Y 值 ， 壁 如 说 它 是 y 或 更 大 的 值 ， 用 仅 产 生 拒 绝 H, 的 p" 来 作为 工 的 选取 ， 则 
P“ 的 选择 应 满足 


P(Y2 v|p = pm 二 -六 人 Jon (1 - p”) (18) 
FTL L=p,*. 然后 对 同样 的 y 值 ， 另 一 个 p” 的 选择 应 使 得 仅 产生 拒绝 域 的 左边 ， 即 
p， 满 足 
s = x. = % — +i 一 py i 19 
P(Y<yl|p =p) => > ja pz) (19) 
A U=p,*, RAÄ (18) 式 和 (19) 式 不 可 能 用 代数 求解 ， 只 能 通过 搜索 程序 在 
计算 机 上 求解 而 得 到 表 A4. 
关于 二 项 参数 器 的 置信 区 间 的 更 多 内 容 ， 可 参见 Clopper 和 Pearson( 1934). 


XF LA U KERE, MAA 1.5.6 来 获得 ， 即 是 说 : 如 果 Y 是 一 
项 随机 变量 ， 具 有 参数 为 p 和 较 大 n， 那 么 


Fa 


"< 


= 20 
Yre (20) 


是 一 个 近似 于 标准 正 态 分 布 的 随机 变量 . 那么 ， 如 果 z ”是 表 Al 中 (1 -oe/2) 分 
位 数 ， 并 注意 到 z， = -n WA 


Y—n 
lC [=a asa an) 
1 一 a/2 Vnpq l-a/2 


= P(—zi-a/2 Vnpq < Y — np < Zi-a/2 V npa) 
对 求 概 率 中 的 不 等 式 两 边 乘 以 〈 -1) ， 不 等 式 改变 方向 ， 
1 — e = P(zi-a/2 Vnpq > np — Y > —z1-a/2 V npa) 


调换 顺序 48 
1 — æ = P(-21-a/2 V npa < np — Y < zi-a/2 V npa) 
= P(Y — Zi-a/2 Vnpq < np < Y + zi-a/2 V npa) 
再 除 以 n, 得 


l-a&= p [Y - a- n H<p<X taan J) (21) 


用 更 进一步 地 近似 ,在 (21) 式 的 根 号 中 用 估计 量 Y/n 来 估计 p， 得 到 


1-x=P 人 -ai a (i) 8881 + Zi-a/2 Ta =) /") 


=P(L<p<U) (22) 
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其 中 , LAUS (14) 式 和 (15) 式 中 的 相同 . 这 后 面 用 Y/n 对 p 的 近似 ， 其 结果 
与 置信 区 间 和 假设 检验 略 有 些 不 同 ， 当 样本 量 较 大 时 ， 两 者 都 可 以 用 . 
在 上 述 过 程 中 ， 对 工 ,V 同 乘 以 样本 容量 n， 这样 nL 和 nU 就 给 出 了 nP 的 置信 
上 、 下 限 ， 它 可 用 来 检验 包括 二 项 随机 变量 均值 在 内 的 假设 ， 因 为 
Ho: p = p* 
等 价 于 
Ho: np = np* = 
其 他 给 出 二 项 分 布置 信 限 的 方法 可 参见 Anderson 和 Burstein( 1967 ,1968 ) Quesenber- 
ry 和 Hurst ( 1964) 及 Goodman( 1965 ) 则 给 出 了 处 理 多 项 比例 的 联合 置信 区 间 的 方法 . 
习题 
下 面 的 每 一 个 练习 中 ， 在 需要 的 地 方 应 清楚 地 陈述 H,,H,,T; 判定 原则 ; a; 判定 结果 ; 
P- 值 以 及 所 用 检验 的 名 称 . 
l. 已 知 某 种 昆虫 的 20% 显 示 出 特性 A， 在 非 正 常 的 环境 下 得 到 18 只 这 种 昆虫 ， 没 有 一 只 具 
有 特性 A， 那 么 假设 在 这 种 环境 下 ， 此 种 昆虫 和 通常 环境 一 样 有 0.2 的 概率 显示 特性 A, 
这 合理 吗 ? 用 双边 检验 . 
2. 在 一 次 安全 月 活动 中 ， 所 检查 的 16 辆 车 中 有 6 辆 车 是 不 安全 的 . 检验 零 假设 : 这 些 车 中 
有 不 多 于 10% 的 车 是 不 安全 的 . (这 个 应 用 中 哪个 假设 更 可 能 是 假 的 ?) 
3. 掷 一 对 般 子 180 次 ， 事件 “两 个 点 数 之 和 为 7” 共 发 生 38 K. 如 果 角 子 是 均匀 的 ， 那么 
出 现 “7” 的 概率 是 1/6， 如 果 是 不 均匀 的 ， 那么 概率 更 高 . 
(a) 如 果 角 子 是 均匀 的 ， 用 单 边 检 验 此 次 游戏 出 现 “7” 的 次 数 是 否 正常 . 
(b) 应 用 大 样本 逼近 , R P( 出现 “7”) 的 95% 置信 区 间 . 
4. ”在 习题 2 中 ,不 安全 车 真实 比例 的 90% 置信 区 间 是 什么 ? 
5. ”从 服从 未 知 分 布 F(x) 的 随机 变量 X 中 得 到 如 下 独立 的 20 个 观测 值 . 


142 134 98 119 131 
103 154 122 93 137 

86 119 161 144 158 
165 81 117 128 103 


求 F(100) 的 95% 置 信 区 间 . 

6 一 个 市 民 小 组 向 市 政府 报告 说 ， 至 少 有 60% 的 居民 认同 特殊 的 发 行 债券 .市 政府 随后 就 
随机 调查 了 100 个 居民 ， 问 他 们 是 否认 同 这 种 特殊 的 债券 ，48 个 人 表示 同意 ， 问 这 个 市 
民 小 组 的 报告 是 否 合 理 ? 

7. 最 近 的 20 个 公司 兼并 案 中 ， 有 5 个 因 被 兼并 的 公司 的 反对 而 流产 ， 假 设 它们 是 独立 的 事 
件 ， 试 估计 一 个 兼并 尝试 被 成 功 拒 绝 的 概率 ， 即 ， 找 到 一 个 95% 的 置信 区 间 . 

(a) 用 表 A4. (b) 用 表 Al. 

8. 一 个 老师 想 调整 一 门 继续 教育 课程 的 难度 水 平 ， 来 满足 学 生 的 需要 ， 他 教 了 几 次 课 ， 并 
且 每 次 给 学 生 们 一 个 简单 的 评价 调查 问卷 ， 他 发 现 12 个 学 生 认 为 课程 太 简单 ，84 个 学 生 
认为 课程 合适 ，3 个 人 认为 课程 太 难 ， 试 检验 零 假设 : 学 生 们 等 可 能 地 认为 课程 太 简单 或 
太 难 ， 双 边 备 择 假设 : 课程 的 难度 水 平 需要 改变 ， 显 著 水 平 取 5 多 ， 
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设 在 20 个 独立 基本 试验 观测 中 有 3 个 成 功 ， 且 检验 的 零 假设 是 P( 成 功 ) <0.3， 备 择 假 设 是 
P( 成 功 ) >0.3, 试用 二 项 公式 求 精确 p- 值 (临界 值 ). 


.20 个 得 克 萨 斯 理工 大 学 法 律 学 院 的 毕业 生 参 加 了 法 律 毕业 考试 ，18 个 通过 ， 如 果 它 表示 


整个 得 克 萨 斯 理工 大 学 法 律 学 院 毕 业 生 的 一 个 随机 样本 ， 问 这 能 否 证 明 整 个 得 克 萨 斯 理 
工大 学 法 律 学 院 毕 业 生 通过 法 律 考试 的 概率 比 州 平均 水 平 (70%) 高 ? 


.在 水 下 战争 演习 中 发 射 了 20 枚 鱼雷 ， 有 15 枚 击 中 目标 ， 求 一 枚 鱼雷 击 中 目标 概率 的 


90% 置信 区 间 . 
(a) 用 表 A4 求解 . (b) 用 大 样本 通 近 求解 . 
(c) 讨论 在 求解 问题 中 你 所 做 的 假设 . 


. 70 种 化 学 检测 试剂 一 起 放 在 气体 室 里 一 段 固定 时 间 ， 往 气体 室 里 充 人 一 定量 的 致命 气体 . 


56 种 试剂 对 这 种 致命 气体 反应 呈 阳 性 ,其 他 14 种 则 没 用 阳性， 求 在 这 种 条 件 下 能 呈 阳 
性 概率 的 90% 置信 和 区间. 


思考 题 


l. 


2. 


连续 性 修正 显然 ， 如 果 Y 服从 二 项 分 布 ， 那么 

P(Y <4) = P(Y <4.1) = +- : = P(Y <4.999) 
因为 Y RERAN, 4,53, RERA, MA, MESANE 
分 布 时 ， 我 们 应 用 哪个 数 : 4,4. 1， 还 是 其 他 什么 数 ? 连续 性 修正 ( 由 于 我 们 试图 用 一 
个 连续 分 布 ， 如 正 态 分 布 去 逼近 一 个 离散 分 布 ， 如 二 项 分 布 ) 就 是 用 离散 分 布 的 两 个 邻 
近 值 的 中 间 数 ， 即 ， 在 二 项 分 布 中 估计 ， 我 们 用 


4 二 0.5 一 “P 
P(Y <4 sP (z< ** 2 
( ) Pas 


估计 P(Y<4) ， 其 中 ，Z 服从 正 态 分 布 ， 而 4.5 是 4 和 5 的 中 间 数 ， 
通常 ， 连 续 性 修正 用 在 正 态 分 布 台 近 二 项 分 布 时 效果 很 好 . 
(a) 对 于 n=20,p =0.1， 用 表 A3 R P(Y<1) 的 准确 值 ， 并 用 正 态 分 布 表 近来 估计 
P(Y<1).， 先 不 用 连续 性 修正 ， 再 用 连续 性 修正 ， 看 哪个 估计 更 接近 准确 值 ? 
(b) 重复 (a), 而 将 p=0.1 换 为 p =0.3， 哪 个 估计 更 接近 准确 值 ? 
A Y, , Y, 是 两 个 独立 的 分 别 服从 参数 n, ,P 和 n, ,p; 的 二 项 分 布 的 随机 变量 . 
(a) 证 明 Y,/n, - Y,/n, 的 均值 为 p, -Pa 
(b) 证 明 Y,/n, - Y.,/n, 的 方差 是 pj (1 — p, )/n, +p,(1 - p, )/n,. 
(c) 说 明 可 用 Y (n, - Y, )Z/m + Y, (n, - Y, )/n; 来 估计 Y/n - Y,/n, 的 方差 . 
(d) 如 果 Y/n, - Y,/n, 近似 服从 正 态 分 布 , 证明 (p, - p.) 的 一 个 置信 和 度 近 似 为 1 -a 
的 置信 区 间 可 由 下 式 给 出 : 
A Epi 有 
n H nyi m 
其 中 
s = VY(m — Y)/nl + Yam — Yx) / n} 


ŠI — 2 H # Al 得 到 . 
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3.2 ”分 位 数 检 验 和 X 的 估计 


二 项 检验 可 以 用 来 检验 有 关 随 机 变量 分 位 数 的 假设 ， 此 时 ， 我 们 称 之 为 分 位 数 [135] 
检验 . 例如， 我 们 检验 一 个 随机 变量 X 的 随机 样本 值 ， 看 它 的 中 位 数 是 否 为 17， 如 
果 X 的 中 位 数 是 17， 那 么 应 当 大 约 各 有 一 半 的 观测 值 落 在 17 的 两 边 ， 正 如 p = 1/2 
的 二 项 分 布 那样 . 如果 有 很 少 的 样本 观测 值 小 于 17,， 那 么 X 的 中 位 数 应 当 大 于 17, 
如 果 有 很 多 样本 观测 值 小 于 17， 那 么 X 的 中 位 数 小 于 17. 

度量 尺度 对 于 分 位 数 检验 至 少 是 次 序 尺度 ， 虽然 二 项 检验 只 需要 弱 名 义 尺度 来 
度量 .这 是 因为 分 位 数 几 乎 与 度量 的 名 义 尺度 没有 关系 . 如 果 被 检验 的 随机 变量 是 
连续 的 ， 检 验 的 假设 是 : 

Ho: X 的 p* 分 位 数 是 指定 的 x* 

由 分 位 数 的 定义 ， 这 等 价 于 

Ho: P(X < x*) = p* 
如 果 我 们 用 p 代表 未 知 的 概率 P(X<x”) ， 则 H, 变 为 : 

Ho: p = p* 
这 与 二 项 检验 的 原 假设 是 相同 的 .检验 统计 量 等 于 样本 值 小 于 或 等 于 二 的 个 数 ， 可 
以 用 双边 二 项 检验 . 
如 果 假 设 随 机 变量 不 是 连续 的 ， 那 么 情况 就 没有 这 么 简单 了 ， 此 时 零 假 设 为 : 

Ho: XX 的 p* 分 位 数 是 x* 

等 价 于 
Ho: P(X <x*) Zp* 和 P(X < x*)< p* 

现在 可 以 用 二 项 检验 ， 但 是 对 这 个 假设 检验 的 修改 需要 一 些 技 巧 ， 所 以 我 们 将 给 出 
单独 检验 的 方法 . 


> 分 位 数 检验 
数据 OX X X, 是 一 组 随机 样本 ， 数 据 由 X, 的 观测 值 组 成 
假定 条 件 


J. 这 些 X 是 随机 样本 ( 即 ， 它 们 是 独立 同 分 布 的 随机 变量 ). 

2. 度量 尺度 至 少 是 须 序 的 . 
检验 统计 量 ”在 这 个 检验 中 我 们 将 用 两 个 检验 统计 量 . 令 T, 等 于 观测 值 中 小 于 等 于 
x* 的 个 数 ，T, 等 于 观测 值 中 小 于 x* 的 个 数 . 那么 ， 当 数据 中 没有 数 严格 等 于 x" 的 数 
时 
零 分 布 “ 检 验 统 计量 T, MT, 的 零 分 布 是 二 项 分 布 ， 参数 n= 样本 有 量 , p =p” 和 和 零 假 
设 一 样 ， 在 表 A3 中 给 出 了 n<20， 和 选 定 p 值 时 的 零 分 布 . 
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FHI n, p, BESSE. 即 , 了 的 近似 分 位 数 x, 为 
m=n:p+z Vn:p:(l—p) (1) 
其 中 ，z, 是 标准 正 态 随机 变量 的 q 分 位 数 ， 在 表 Al 中 给 出 . 
假设 < x` ,p” 为 指定 的 值 ，0 <p”<1， 则 假设 可 能 是 如 下 三 种 形式 中 的 一 种 . 
A. (双边 检验 ) 
Ho: 第 请 个 总 体 的 分 位 数 为 zx 
[这 等 价 于 H,:P(x<x*)>p*#l P(X<x*)=<p*, HP X 52: X, 有 相同 的 分 
布 . ] 
Hi: x* 不 是 第 p* 个 总 体 的 分 位 数 
拒绝 域 对 应 于 T, 其 值 太 大 [说 明 可 能 P(X<x*) 大 于 p*] 或 对 应 于 Ti 其 值 太 小 
[说 明 可 能 P(X<x* ) 小 于 p*]， 和 双边 二 项 检验 一 样 ， 通 过 表 A3， 样 本 量 n, 假设 
概率 p”， 可 以 得 到 拒绝 域 ， 找 到 二， 使 得 
P(Y St) = a (2) 
其 中 ，Y 服从 参数 为 n 和 p” 的 二 项 分 布 ,，a, 是 给 定 显著 性 水 平 的 一 半 .， 得 到 n, 
使 得 
P(Y<)=1- a (3) 
其 中 ， 选 % 使 得 w + a, 大 约 等 于 给 定 的 显著 性 水 平 . 如 果 T 小 于 等 于 +,, RT, 大 
于 1t,， 拒 绝 H,， 否 则 接受 H,， 显 著 性 水 平等 于 a +a. 
对 于 n>20 RK A3 中 没有 的 p" 值 ， 由 (1) 式 分 别 令 g9=a/2 Mq=1 -a/2, R 
出 t = x > fll L, = X | _.⁄2: 
p- 值 是 二 项 随机 变量 Y 小 于 等 于 观测 值 T. ， 或 大 于 等 于 T 的 概率 中 较 小 值 的 2 
倍 ， 当 n<20,p=p”" 时 ,可 以 从 表 A3 查 出 ， 对 于 n>20 用 表 Al , H 
Ti 一 所 -7 十 0.5 
po<T)=P(z <) (4) 
T. — n: p* — 0.5 
P(Y >T) =1 —P (z <DE) 
两 式 与 0.5 作为 “对 连续 性 的 修正 ”， 来 改进 正 态 对 二 项 分 布 的 通 近 . 
B. (左边 检验 ) 
Ho: 总 体 的 p* 分 位 数 不 大 于 x* 
[s& M: P( X< x*)>p*. ] 
Hi: 总 体 的 p* 分 位 数 大 于 x* 
[或 Hi: P(X<x*) <p*. ] 
T, 的 值 较 小 时 ， 表 示 H, 是 假 的 ， 所 以 用 样本 量 n 和 特定 的 概率 值 六 在 表 A3 中 
得 到 t, ， 使 得 
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P(Y<t)=a (6) 
对 于 可 以 接受 的 水 平 ag， 其 中 Y 服从 参数 为 n Mp 的 二 项 分 布 ， 如 果 T 小 于 等 于 4， 
则 拒绝 Ho WRT, 大 于 1 ， 则 接受 肪 ， 当 n>20 时 , 在 (1) 式 中 令 q =a, t= x. 
Pp- 值 等 于 二 项 随机 变量 Y 小 于 等 于 观测 值 T 的 概率 ， 当 n<20,p = 六 时 ， 可 从 
K A3 查 出 ， 对 于 >20, 表 Al 用 (4) R, AR Al 中 可 得 到 . 
C. (右边 检验 ) 
Ho: 总 体 的 p* 分 位 数 大 于 等 于 x* 
[这 等 价 于 HH,: P(X <x*) <p°. ] 
i: 总 体 的 p* 分 位 数 小 于 x* 
[RENT H: P(X<x*) >p". ] 
由 于 较 大 的 T, 表示 零 假设 是 假 的 ， 到 表 A3 中 ， 用 样本 量 n 和 假设 的 概率 p* fE 
为 p ,得 到 t, ， 使 得 
P(Y >t)=a 
对 可 接受 的 显著 性 水 平 w， 它 等 同 于 
P(YSh)=1-a (7) 
WRT, 大 于 六 ， 则 拒绝 H, WR T, FEF h, WZ H. XIF n>20, 在 1 式 中 
令 qg=1 -a, 得 到 1, = x _,.. 
Pp- 值 是 二 项 随机 变量 Y 大 于 等 于 观测 值 T, 的 概率 ， 当 n<20,p =p” 时， 它 可 从 
表 A3 中 查 出 ， 对 于 n>20, 用 (5) R, CTAR Al 中 查 出 . 
计算 机 辅助 ”Minirab 在 Median Test 的 名 义 下 ， 可 以 检验 当 p =1/2 的 零 假设 . 
例 3. 2. 1 
大 学 新 生 人 学 后 要 参加 一 个 特殊 的 高 中 学 业 考 试 ， 多 年 以 来 成 绩 的 上 四 分 位 数 是 
193， 某 个 高 中 有 15 名 毕业 生 上 了 大 学 ， 他 们 参加 了 考试 ， 得 分 如 下 : 
189 23 19 160 212 


176 231 185 199 213 
202 193 174 166 248 


认为 这 15 个 学 生 是 这 所 高 中 上 大 学 的 所 有 学 生 的 一 个 随机 样本 ， 比 较 这 所 高 中 毕 
业 的 学 生 和 其 他 大 学 新 生 的 一 个 方法 就 是 检验 假设 : 上 面 所 给 出 的 分 数 来 自 一 个 上 
四 分 位 数 是 193 的 总 体 ， 即 


< 


Ho: 上 四 分 位 数 是 193 
相应 的 备 择 假设 是 
Hi: 上 四 分 位 数 不 是 193 
此 处 ,我 们 讨论 这 所 大 学 里 以 前 、 现 在 和 将 来 来 自 这 所 高 中 的 学 生 的 分 数 的 上 四 分 位 数 . 
用 双边 分 位 数 检验 ， 水 平 大 约 为 0.05 的 临界 域 可 以 通过 表 A3 查 到 ， 此 时 n=15 和 


P=0.75， 可 以 看 出 ， 对 于 二 项 随机 变量 Y 
P(Y <7) = 0.0173 (8) 
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和 
P(Y<14) = 0.9866 = 1 — 0.0134 (9) 
水 平 为 a 的 临界 域 
æ = 0.0173 + 0.0134 = 0.0307 (10) 
对 应 于 T 小 于 等 于 +t =7 MT, 大 于 等 于 1 =14. 
在 这 个 例子 中 T, =7， 观 测 值 小 于 等 于 193， 由 于 一 个 观测 值 严 格 等 于 193， 所 
以 T=6， 因此， 因为 T, 太 小 ， 所 以 拒绝 有 加， 来 自 那 所 高 中 的 学 生 的 上 四 分 位 数 不 
Æ 193, ，p- 值 是 2. P( Y<7) =2(0.0173) =0. 0346. m 
下 面 举 例 说 明 单 边 分 位 数 检验 和 大 样本 近似 . 
例 3. 2.2 
记录 了 112 次 黄石 公园 的 老 忠实 间 吹 泉 喷 发 的 间隔 时 间 ， 要 检测 间 软 时 间 的 中 位 数 
是 否 小 于 等 于 60 分 钟 〈 零 假设 ) ， 或 中 位 数 是 否 大 于 60 分钟 ( 备 择 假设 )， 如 果 中 
位 数 区 间 是 60， 则 60 是 x ;或 是 中 位 数 ， 如 果 时 间 间 隔 的 中 位 数 区 间 小 于 60， 则 60 
是 某 个 p 宇 0.5 的 p 分 位 数 ， 所 以 H, 是 P(X<60) >0.50,H, 是 P(X<60) <0.50, 
其 中 XX 是 喷发 的 间隔 时 间 . 假设 各 时 间 间 隔 是 独立 同 分 布 的 ， 可 以 用 左边 分 位 数 检 
验 ， 检 验 统计 量 T, 等 于 间隔 时 间 小 于 等 于 60 的 次 数 ，0. 05 的 临界 域 ， 对 应 于 工 | 小 
于 等 于 
ti = np* + zoos Vnp*(1 = p*) 
= (112)(0.50) — (1.645) V(112)(0.50)(0.50) = 47.3 (11) 
在 记录 的 112 次 时 间 间 隔 中 ，8 个 是 小 于 等 于 60 分 钟 的 ， 所 以 T, =8, H, 很 容易 被 拒 
绝 ， 倾 向 于 备 择 假设 “间隔 时 间 的 中 位 数 大 于 等 于 60 分钟， 用 (4) 式 得 出 p- 值 . 
P(Y<8) |P |z susta 
V(112)(0.50)(0.50) 
读 为 “ 远 小 于 0.0001”. m 
口 理论 ”首先 ， 我 们 解释 为 什么 A,B,C 中 括号 内 的 假设 等 价 于 不 在 括号 内 的 假设 ， 
也 许 这 很 容易 从 一 个 任意 分 布 函 数 的 图 像 中 看 出 ， 如 图 3-1. 


F(x) 


| = P(Z < —8.977) << 0.0001 (12) 


= 
w 


X) X2 
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分 布 函数 在 刀 点 有 3 种 状态 : 它 可 能 像 在 x 点 一 样 垂直 上 升 ; 可 能 像 在 x 点 一 
样 为 水 平 线段 ; 或 像 在 x, 点 一 样 逐渐 上 升 . 第 2 个 假设 (B 假设 ) 的 零 假设 H, 中 提 
出 总 体 的 p* 分 位 数 (x,.) 不 大 于 x*, RE x. <x*. 因为 x* 的 每 一 个 值 都 可 以 看 作 
是 某 种 类 型 的 分 位 数 ， 我 们 可 以 说 x 是 对 应 某 个 p 的 p 分 位 数 ， 如 p。( 我 们 直接 从 
分 位 数 的 定义 出 发 ， 而 暂时 忽略 只 选择 水 平 线段 的 中 点 作为 分 位 数 的 习惯 . ) 因为 分 
布 函数 的 图 像 随 着 x 的 增加 不 会 降低 ， 所 以 x,. x 意味 着 p” 三 pe ， 这 可 以 从 我 们 假 
设 x* 是 图 3-1 中 由 xi ,mm ,x 代表 的 三 种 情况 中 的 任 一 种 看 出 来 ， 由 任何 落 在 x 左边 
的 x,， 可 以 得 出 x 点 的 纵 坐 标 p” 不 大 于 x" 点 的 纵 坐 标 po 由 分 位 数 的 定义 和 定义 
1.4.1， 得 


P(X>x*)<1-po (13) 
和 
po <1 -— P(X > x*) = P(X <x*) (14) 
等 价 ， 由 于 p” <p。， 说 明 
p*<P(X <x") (15) 
这 等 价 于 B 部 分 的 原 假设 H, WE H, 的 对 立 假设 是 及 ,与 (15) 式 对 立 的 是 
p* > P(X <x*) (16) 


这 正如 备 择 假设 所 陈述 的 一 样 。 同 理 ， 可 以 用 来 证 明 其 他 假设 情况 的 等 价 形式 . 
简单 地 说 ， 图 3-1 可 以 形象 地 说 明 x. <x (CPRH) BEAR psp. WMR" 
=x,， 那 么 由 定义 1.4.1 知 
P(X < x*) < po <p* (17) 
为 真 ， 也 是 H, 的 等 价 形式 . 

二 项 检验 可 以 直接 用 来 检验 括号 中 的 零 假 设 .C 中 的 H, 检验 可 以 通过 定义 二 项 
检验 的 “第 一 类 ”为 小 于 好 的 观测 来 检验 ，B 中 的 H, 通过 将 “第 一 类 ”看 作 小 于 
等 于 x* 的 观测 来 检验 ， 结 合 B 和 C 中 的 检验 就 得 到 A 中 的 双边 检验 .二 项 检验 中 独 
立 性 和 概率 p 为 常数 的 假设 是 能 够 成 立 的 ， 因 为 X, 是 独立 同 分 布 的 (分 别 地 ).， 口 

在 前 面 章 节 中 我 们 给 出 了 如 何 寻 找 概率 p 的 置信 区 间 ， 同 样 的 方法 可 以 用 来 寻找 
分 布 函数 在 某 点 x 的 值 F(x ) 的 置信 区 间 ， 即 给 定 x。， 我 们 能 用 前 面 的 方法 找到 未 知 
概率 F(x,) 的 一 个 “ 竖 直 的 ”置信 区 间 ( 见 图 3-1)， 假 设 给 定 概率 (不妨 为 p”)， 要 
求 未 知 分 位 数 x,,“ 水 平 态 ”的 置信 区 间 .， 如 果 我 们 给 出 一 个 特定 的 分 位 数 ， 如 中 位 
数 ， 上 四 分 位 数 ， 或 任何 p* 分 位 数 ， 其 中 p 是 个 特定 的 常数 ， 且 0 <p”<1， 则 可 以 找 
到 这 种 第 二 类 型 分 位 数 的 置信 区 间 ， 并 有 如 下 所 述 形 式 : 

P(X < xp EX))=1-a (18) 
其 中 ,1 -a 是 已 知 的 置信 系数 ，X'”,X"” 是 已 知 第 r 和 第 s AKERE (EX 
2.1.4). rA s 的 值 可 以 在 只 知道 样本 量 和 置信 系数 的 情况 下 ， 由 下 一 步 抽取 样本 的 
方式 提前 决定 ， 样 本 X,,X,,…,X, 只 需 是 随机 的 ， 而 对 X, 的 分 布 没有 任何 限制 ， 所 
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以 这 个 统计 方法 可 以 用 于 任何 总 体 的 随机 样本 . 
> 分 位 数 的 置信 区 间 


数据 数据 由 独立 同 分 布 的 随机 变量 X ,X,,…,X, 的 观测 组 成 ， XX” <... < 
X” 三 …< 生 XI 三 … 生 X ”为 次 序 统计 量 ，1 和 r<s 三 由， RARA p* (未 知 的 ) 分 位 
数 ，p”" 是 0 到 1 之 间 的 某 个 指定 数 . 
假定 条 件 

l. X, ,XX,,…,X, 是 随机 样本 . 

2. X, 的 度量 尺度 至 少 是 次 序 的 . 
方法 A (小 样本 ) ”对 于 n<20 可 以 用 表 A3 来 寻找 r+ 和 s.， 在 表 A rh, 2 p =p*#l 
样本 量 n， 沿 着 p =p” 的 列 向 下 找 ， 直 到 有 近似 等 于 ov2 的 值 ， 此 时 ，1 -a 近似 于 给 
定 的 置信 系数 ， 称 这 个 近似 值 为 w ， 相 应 的 y 值 (远离 w 左边 ) 是 +-1， 加 1 得 到 
r， 然 后 继续 沿 着 这 列 向 下 找 ， 直 到 有 近似 等 于 1 - (a/2) 的 值 ， 称 为 1 -a,， 对 应 
l-a, 的 y 值 ， 记 作 s-1,， 加 1 得 到 ss， 这样 我 们 得 到 了 a ,az ,r,?， 准 确 置信 系数 是 
l-a - a,， 区 间 估 计量 是 X"”,X” 之 间 的 区 间 ， 而 X"”,X“” 可 以 从 数据 中 得 到 . 
那么 ， 


P(X” < x, < X) >1 — a — a (19) 
给 出 了 置信 区 间 . 如 果 假 设 未 知 的 分 布 函数 是 连续 的 ， 那 么 ， 
P(X” < x, SX“) =1 — a — oo (20) 


和 (18) 式 所 述 的 一 样 . 
方法 B (大 样本 近似 ) ”对 于 nn 大 于 20， 可 以 用 基于 中 心 极限 定理 的 晕 近 ( 见 (1) 
式 ) ,计算 


r*=np*+Zza2 Vnp*(1 — p*) (21) 
和 
s* = np? + Zı-a/2 V np*(1 — p*) (22) 


其 中 ， 分 位 数 z 从 表 Al 找 出 ，1 -a 是 给 定 的 置信 系数 .一 般 地 ， r,s 不 是 整数 . 
邻 r 和 ss 是 r*,s* 向 上 取 整 的 整数 ， 则 (19) 式 给 出 了 近似 置信 区 间 ， 如 果 未 知 分 布 
函数 是 连续 的 ， 则 近似 置信 区 间 由 (20) 式 给 出 . 
像 所 叙述 的 一 样 ， 单 边 的 置信 区 间 可 以 通过 只 找 r sk s 得到. 单 边 置信 区 间 有 

形式 

P(XM <xp)=1— a (23) 
和 

P(x SX") =1 — a (24) 


如 果 分 布 函数 是 连续 的 ， 则 为 
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P(X” <x) Z1 -— a (25) 
和 
P(x, < X8)) 21 — a (26) 
计算 机 辅助 Minitab {在 Median Test F) 和 StatXact (在 Sign Test F) 可 以 得 出 中 
p R0 Tr Rl, = 一 F 
例 3. 2.3 


从 一 批 待 测 晶 体 管 中 随机 抽出 16 个 进行 检测 ， 记 录 每 个 品 体 管 的 寿命 ， 硕 望 得 到 上 四 
分 位 数 的 置信 系数 近似 90% 的 置信 区 间 . 查 表 A3, n=16,p =0.75. 沿 p =0.75 列 问 
下 找 ， 选 择 概率 0.0271， 因 为 它 接 近 0.05， 对 应 a, =0.0271 的 y 值 为 y =8; 所 以 r 等 
于 9， 最 接近 0.95 的 概率 是 0.9365 =1 -a,， 它 对 应 的 y 值 为 14， 所 以 s 等 于 15， 置 
信 区 间 为 
P(X® < xozs < X“) = 0.9094 (27) 
(可 以 假定 寿命 是 连续 随机 变量 ， 所 以 可 以 用 (20) 式 . 
以 递增 的 顺序 列 出 检验 的 结果 ， 如 下 : 

XI =469 XŠ=568 X9 =633 WXU)= 67.1 

XQ) = 472 XO=592 X02364  X0 = 677 

X9=491 X”=59 XW=637 XU 733 

XW) 565 X%@=632 X03644  X090 = 78.5 


H T X°? =63.3,X'U =73.3， 我 们 可 以 说 “从 63.3 小 时 到 73.3 小 时 的 区 间 是 上 四 + 


分 位 数 的 90. 94m% 置信 区 间 .” 
H (21) 和 (22) 式 ， 用 大 样本 近似 ， 得 到 
r* = (16)(0.75) + (一 1.645) V(16)(0.75)(0.25) 
= 12 — 2.86 = 9.14 (28) 
和 
s* = 12 + 2.86 = 14.86 (29) 
Mmi, r=10,s=15,90% WIARE (63.4,73.3) ， 比 精确 方法 得 到 的 区 间 略 小 ， 硬 
口 理论 首先 考虑 分 布 函数 是 连续 的 这 种 较为 简单 的 情况 、 如 果 .是 p” 分 位 数 ， 则 
有 如 下 严格 关系 
P(X > xp) = P(X>Xp)=1—p" (30) 
其 中 , X EAA RR mBüSLEE BJ Th AREE. 
次 序 统计 基 XU ， 假 设 大 于 某 个 确定 的 常数 ， 只 要 样本 中 最 小 的 数 都 大 于 这 个 常 
数 ， 所 以 只 要 样本 中 个 值 都 大 于 这 个 常数 ，X'" 就 大 于 这 个 常数 ， 选 择 x,: 作 为 这 个 
常数 ， 可 以 得 到 
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P(xp < X) = P( 所 有 的 样本 值 都 大 于 xp") 


= P(xp < Xi, Xp < Xz. ar , Xy: < Xp) 
= P(x, < X:) ' P(t < X) ° ° * > -P{xp < Xp) 
= (1 — p*)' (31) 


因为 X, EIAS, IEEE EIRE p“ AER x,.. 


如 果 如 ,小 于 X ， 那 么 在 X qx. <X 中 , 164 -1 个 观测 值 大 于 过 .， 或 者 
在 <X <X 中， 有 nn 个 观测 值 大 于 x,.， 所 以 
P(xy < X®) = P(x < XW) + PIXOS xp < X”) 
= P(X rh 3: pf n — 1X T xp) 
= P(X rR *##£#+#14`<x,:) (32) 
现在 ，(32) 式 中 的 概率 由 二 项 分 布 函 数 给 出 ， 因 为 每 个 已 都 有 小 于 等 于 x 的 概率 
p*, HB X, 是 互相 独立 的 .所 以 由 (32) 式 可 以 得 到 
P(x, < Xh = >) B (pa -p (33) 


i=0 


在 (1.3.8) 式 中 的 二 项 分 布 函 数 之 下 ， 之 前 的 讨论 可 以 作 如 下 推广 ， 
P(xp: < X”) = P(X 中 至 少 有 n — r + 1 大 于 Xj*) 
P(Xi 中 至 多 有 r isi 14 < x;:) 


-5 (") pa -p 
< u] p (34) 
置信 系数 由 下 式 得 出 
1- a= P(X” <x, < X°) 
= P(xy < X°) — P(x,. < X") (35) 
从 而 , 由 (34) RAK A3 可 以 得 到 ”>,*， 使 得 
1-a = Pr <X9) = 1-2 (36) 
和 
al = P(xp < X) = = (37) 
则 置信 系数 是 1 - a, -a,=l-a 注意 ， 因 为 假设 分 布 函数 是 连续 的 ， 我 们 有 
P(xp < X) = P(xp: < X®) (38) 


因此 ， 可 以 用 表 A3 得 到 s. 
如 果 刁 的 分 布 函数 和 成 的 分 布 函数 不 是 连续 的 ， (30) 式 不 成 立 ， 由 定义 
1.5.1， 我 们 有 
P(X> xy) <1 — p* (39) 


和 
P(XZx,.)21 — p* (40) 
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首先 ， 我 们 考虑 (39) 式 怎 样 影响 (34) 式 ， 进 而 影响 (37) 式 求 r 的 方法 . 
因为 (39) 式 成 立 ， 每 个 观测 值 大 于 x,: 的 概率 小 于 当 羡 是 连续 时 的 值 ， 所 以 每 个 
次 序 统 计量 大 于 x. 的 倾向 ， 小 于 为 连续 时 的 情形 . 即 概率 P(x,. <X”) 小 于 连续 
HJ (34) 式 给 出 的 值 ， 所 以 ， 一 般 情况 下 ， 下 式 成 立 


P(x,. < Xt) < 5 C) (pa-p (41) 
i=0 
如 果 用 上 面 介绍 的 方法 从 表 A3 Pir, IWA 
P(x,. < X”) <a; (42) 


现在 ， 我 们 来 考虑 (40) 式 怎样 影响 通过 选择 s 的 值得 到 概率 1 - a, 的 .因为 
(40) 式 成 立 ， 每 个 观测 值 大 于 等 于 x*r 的 概率 大 于 连续 时 的 概率 ， 所 以 观测 值 大 于 
等 于 zx 的 个 数 比 连续 时 多 ，X ”>= 光 的 概率 大 于 连续 时 的 情况 因此，(34) 式 可 以 
改 为 适应 一 般 情况 的 式 子 . 


s—1 i 
P(x < X°) >> (") (p*y( — p (43) 
i=0 
所 以 ， 如 果 用 先前 的 方式 在 表 A3 PR s, RIA 
P(xy < X®) >1 — a (44) 


对 于 任何 分 布 都 成 立 的 (42) 和 (44) 式 ， 可 以 按 如 下 方式 使 用 
P(X” <xy < X€) = P(xp < X®) ~ P(xp: < X”) 
>P(xy < Xt) — a; 
21 -— oe — a (45) 
所 以 ， 这 种 方法 对 于 离散 随机 变量 或 有 结 点 的 有 序数 据 是 保守 的 . 因此 ， 求 分 位 数 
的 置信 区 间 的 方法 ， 对 有 二 项 分 布 函数 的 精确 表 可 用 的 情形 也 是 可 行 的 . 

用 大 样本 方法 求 r 和 s 是 基于 用 标准 正 态 分 布 近似 二 项 分 布 的 想法 ， 虽 然 关 于 怎 
样 由 r*,s* 求 得 整数 r,s 的 方法 还 有 不 同 的 争论 , 但是， 此 处 给 出 的 直接 向 上 取 整 的 
方法 是 个 很 接近 的 近似 ， 

这 种 分 位 数 检验 可 以 用 于 处 理 次 序数 据 ， 因 此 比 其 他 参数 检验 方法 更 适用 . 如 
果 数 据 是 以 区 间 为 单位 的 ， 且 服从 正 态 分 布 ， 均 值 等 于 中 位 数 ， 中 位 数 的 分 位 数 检 
验 可 以 比 作 一 样本 的 + 检验， 此 时 渐 近 相对 效率 (A. R. E.) 只 为 2/r=0.637， 对 于 
均匀 分 布 ， 它 是 轻 尾 的 ， 它 的 A. R. E 只 有 1/3 =0.333. 但 是 ， 对 称 的 重 尾 分 布 ， 
如 我 们 所 知 的 双 指 数 分 布 ， 分 位 数 检验 相对 于 上 检验 的 A. R. E. 就 跳 到 了 2.0， 说 明 
对 于 非 正 态 的 重 尾 分 布 ， 分 位 数 检 验 比 参数 检验 更 有 效 . g 

Barlow 和 Gupta( 1966 ) 讨论 了 分 位 数 的 单 边 置信 区 间 在 寿命 检验 中 的 应 用 ， 
Van der Parren(1970) 给 出 了 中 位 数 分 布 自由 置信 限 的 表 和 分 位 数 的 表 (1973), 
Krewski( 1976 ) 和 Reiss 和 Riischendorf ( 1976 ) 讨论 了 分 位 数 之 间 的 区 间 的 置 
fë X. j]. 


[248] 


[149] 
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习题 


1， 一 个 10 年 级 学 生体 重 的 随机 样本 有 如 下 20 个 观测 值 
142 134 98 119 131 103 154 122 93 137 
86 119 161 144 158 165 81 117 128 103 
检验 假设 : 体重 的 中 位 数 是 103. 

2. 在 题 ! 中 检验 假设 : 上 四 分 位 数 至 少 是 150. 

3. 在 题 1 中 检验 假设 : 30% 分 位 数 不 大 于 100. 

4. 在 题 1 中 求 中 位 数 的 近似 90% 的 置信 区 间 ， 准 确 的 置信 系数 是 多 少 ? 比较 用 准确 方法 得 
到 的 结果 和 用 近似 方法 得 到 的 结果 . 

5. 要 设计 某 种 汽车 的 车 内 高 度 以 适应 大 部 分 司机 ， 除 了 那些 占 5% 的 超 高 司机 之 外 ， 以 前 的 
研究 表明 95% 分 位 点 是 70.3 英寸 ,为 了 验证 以 前 的 研究 是 否 仍 然 有 效 ， 选 择 100 个 随机 
样本 ， 发 现 样本 中 最 高 的 12 个 人 有 如 下 高 度 : 

726 700 713 705 708 76.0 
701 725 71.1 70.6 719 728 
用 70.3 作为 95% 分 位 点 合理 吗 ? 

6. 在 习题 5 中 ， 样 本 的 95 多 分 位 点 的 95% 的 置信 区 间 是 什么 ? 

7. 警官 回忆 说 ， 当 年 完成 超越 障碍 训练 需要 42 分 钟 ， 他 怀疑 现在 人 伍 的 新 兵 是 否 能 达到 当 
时 新 兵 的 标准 ， 所 以 他 记录 了 他 们 完成 超越 障碍 训练 的 时 间 . 他 发 现在 38 名 新 兵 中 只 有 
10 个 在 41 分 钟 内 完成 了 训练 .用 分 位 数 检验 假设 : 上 四 分 位 数 是 42 分 钟 ， 相 应 的 备 择 
假设 是 单 边 的 . 

8. 检验 10cm 的 钢板 能 被 子弹 穿 进 多 深 ， 50 发 子弹 射 向 钢板 ,测量 它们 进入 钢板 的 深度 ， 
7 发 子弹 穿 透 钢板 ， 所 以 它们 的 射 进 深度 为 记 为 10 + ， 所 有 50 个 深度 由 小 到 大 如 下 
所 示 : 

5.37, 5.39, 5.42, 5.51, 5.63, 5.74, 5.82, 5.83, 5.94, 5.98, 6.07, 6.07, 6.13, 6.20, 6.21, 6.23, 6.25, 


6.26, 6.26, 6.28, 6.29, 6.31, 6.35, 6.41, 6.57, 6.67, 6.81, 7.03, 7.40, 7.44, 7.82, 8.03, 8.11, 8.44, 
8.51, 8.72, 8.83, 9.04, 9.33, 9.51, 9.61, 9.68, 9.82, 10+, 10+, 10+, 10+, 10+, 10+, 10+ 


求 射 进深 度 的 中 位 数 的 95% 置信 区 间 . 


思考 题 


一 种 求 中 位 数 的 1 -a 置信 区 间 的 参数 方法 是 假设 总 体 服从 正 态 分 布 ， 用 

X + tanS/Vn-1 < xos <X +th-anS/Vn-1 
其 中 总 是 样本 均值 ，$ 是 样本 标准 差 (定义 2.2.3), n 是 样本 量 , 1, ER 421 中 的 p 分 
位 数 ， 自 由 度 为 n-1， 计算 习题 1 中 数据 的 置信 区 间 ， 将 它 与 习题 4 的 非 参 数 a =0. 10 
置信 区 间 比 较 一 下 ， 哪 个 置信 区 间 更 容易 证 明 ? 哪个 置信 区 间 “ 更 好 ” (在 更 短 的 意 
x F AS 
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3.1 和 3.2 节 的 置信 区 间 给 出 了 总 体 未 知 参数 的 估计 ， 如 未 知 概率 p 或 未 知 分 位 
数 x,， 以 及 未 知 参数 在 某 区 间 内 的 1 -a 概率 (置信 系数 )， 容 忍 限 不 同 于 置信 区 间 ， 
因为 容忍 限 给 出 总 体 比 例 至 少 为 q 的 所 在 的 区 间 ， 使 得 此 区 间 “ 确 实 ” 含 有 总 体 比 
例 q 的 概率 大 于 等 于 1 -a， 典型 的 应 用 就 是 我 们 抽取 容量 为 n 的 随机 样本 X, ,X,,…， 
X,， 要 想 知 道 n 需要 多 大 ， 才 能 使 我 们 有 95% 的 把 握 说 总 体 至 少 有 90% 落 在 X""， 
X" 之 间 ， 其 中 X"”,X'" 为 样本 的 最 小 和 最 大 值 。 我 们 可 以 进一步 推广 或 考虑 问题 ， 
“n 至 少 要 多 大 ， 才 能 使 总 体 至 少 有 q 的 比例 落 在 X”,X"* "之 间 的 概率 大 于 等 于 
l-a?” EF, %q,r,m, a 是 事先 已 知 (或 选取 ) 的 ， 只 需要 确定 nn. 

男 一 个 典型 的 情况 是 ， 当 有 nn 个 随机 样本 时 ， 希望 选取 上 下 限 使 得 有 95% 置信 
JE (或 1-a) H, 我们 所 选择 的 置信 限 包含 总 体 的 比例 至 少 为 g， 如 果 我 们 选取 样 
本 的 两 个 极 值 XxX”,X" 为 上 下 限 ， 那 么 总 体 的 比例 q 是 多 少 ? 或 者 我 们 还 是 选 样本 
的 第 二 极 值 X XO 为 上 下 限 ? # 95% 置信 水 平 下 ， 总 体 有 多 大 的 比例 在 这 些 限 
内 ? 在 这 个 问题 中 ，g 是 未 知 量 ， 并 且 当 我 们 知道 或 设置 a,n,r,m 后 可 以 得 到 它 . 

上 面 的 容忍 限 是 双边 容忍 限 ， 单 边 容 忍 限 一 般 有 形式 ,“ 总 体 至 少 有 gq 的 比例 大 
于 X" 的 概率 为 1 -a,” 或 “总 体 至 少 有 4 的 比例 小 于 X ”的 概率 为 1 ~ a. ” 单 边 
容忍 限 与 分 位 数 的 单 边 置信 区 间 是 一 样 的 ， 本 节 将 在 下 面 介 绍 . 

此 处 所 说 的 总 体 是 无 穷 的 或 抽样 是 有 放 何 的 ， 以 使 得 X, 是 独立 的 ， 对 于 有 限 样 
本 ， 其 抽样 是 不 放 回 的 ， 且 样本 容量 n 与 总 体 样本 NN 相 比 很 小 ， 这 些 方法 是 相当 准 
确 的 . 对 于 有 限 总 体 来 说 ， 更 精确 的 方法 可 参见 Wilks( 1962). 


> 容忍 限 


数据 ”数据 包含 来 自 一 个 很 大 总 体 的 随机 样本 X, ,X,,…,X,， 选 择 一 个 置信 系数 1 -a 
和 一 对 正 整 数 r,m， 我 们 要 在 选 定 理想 的 总 体 比例 4 之 后 确定 所 需 样本 容量 (见方 法 
A), 或 要 对 于 给 定 的 样本 容量 n， 再 确定 总 体 比例 g (见方 法 B)， 给 出 一 个 陈述 ， 
“从 X 到 X"* ”的 随机 区 间 里 包含 总 体 比例 q 或 更 多 样本 的 概率 是 1 - a. ”注意 ， 
我 们 约定 X”= -om ,X"* = +e ， 所 以 单 边 容忍 限 可 以 通过 令 r sk m AFR. 
假定 条 件 

l. X,,X,,:: X, 是 一 组 随机 样本 . 

2. 度量 尺度 至 少 是 须 序 的. 
方法 A (Kn) 如果 r+m 等 于 1， 即 如 果 r 或 m 等 于 零 ， 就 像 在 单 边 容忍 限 一 样 ， 
对 合适 的 aq 值 ， 可 直接 从 表 AS 中 得 到 n， 如 果 r+m 等 于 2， 对 合适 的 a,q 值 ， 可 
直接 从 表 A6 中 获得 n， 如 果 表 AS 和 A6 都 不 行 ， 则 用 下 面 的 近似 


_1 1+ 
H =-~- X] 


l+q,1 K 
2 -二 人 十 1) (1) 
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其 中 ,x,_。 是 自由 度 为 2(r+m) 的 x 随机 变量 的 (1 -a) 分 位 数 ， 由 表 A2 得 到 . 
HEB ( 求 9) ”对 于 已 知 的 样本 量 n， 已 定 的 a，r，m， 总 体 比例 g 的 近似 值 由 下 式 给 出 
N = a Re et a 
4n — 27 + m — 1) + Xi-a 
其 中 ,x _。 是 自由 度 为 2(r+m) 的 x 随机 变量 的 《1 -a) 分 位 数 (由 表 A2 得 到 ). 
RAR ”对 样本 容量 为 x， 总 体 至 少 有 q[ 或 (100)(q)%] 的 比例 落 在 X” p x 
之 间 的 概率 至 少 为 1 -a， 即 


(2) 


P(X 中 < 总 体 至 少 有 9 的 比例 三 XW) 宇 1 — a: (3) 
对 于 单 边 容 忍 区域 ， 令 + 或 等 于 零 ， 其 中 X”= -%,X”* = +%， 可 用 类 似 于 上 
Wm qI ki; <=—=—— n s 


例 3. 3. 1 
使 用 最 广泛 的 双边 容忍 限 是 r=1,m=1， 在 某 流 行 的 豪华 轿车 中 配 有 电动 座位 调节 
器 ， 制 造 商 想 了 解 调节 的 高 度 范围 ， 使 得 在 90% 的 概率 下 ， 至 少 有 80% 的 法 在 买主 
(总 体 ) 能 够 调节 座位 到 理想 的 高 度 ， 样 本 容量 n 是 多 少时 ， 才 能 使 X”,X 分 别 
是 容忍 限 的 上 下 限 ? 

TEK A6 中 令 q =0. 80,1 -a =0. 90, pe 由 (1) 式 近 似 得 到 


L I _ 

n = 1 Xi-a T 十 二 +m 1) 

saie 18.003 
0.20 E 


从 潜在 买主 中 抽取 18 个 人 作为 一 个 样本 ， 测 量 从 一 个 基准 高 度 起 所 调节 的 高 
度 ， 样 本 中 最 大 值 是 


X08) = 7.57 英寸 
最 小 值 是 
XU = 1.21 英寸 
所 以 ， 至 少 有 80% 的 人 需要 调节 座位 垂直 高 度 等 于 或 在 1.21 和 7. 57 英寸 之 间 的 概 
率 为 0. 9. E 
下 面 是 一 个 单 边 容忍 限 的 例子 . 
例 3. 3.2 


在 一 些 钢 盘 中 ， 制 造 商 保证 每 批 至 少 有 90% 的 钢筋 有 一 个 超过 额定 数 的 断裂 临界 
点 ， 因 为 制造 环境 不 同 ， 通 过 找 每 批 随机 样本 的 断裂 点 ， 来 分 批 建立 所 保证 的 断裂 
临界 点 ， 让 所 保证 的 断裂 临界 点 等 于 样本 的 最 小 断裂 临界 点 . 需要 多 大 的 样本 量 ， 
制造 商 才 能 有 95% 的 把 握 说 他 们 的 保证 是 正确 的 ? 

ER A5 中 , 令 g=0.90,1 -a =0.95, 得 到 n 是 29， 每 批 随机 抽取 29 个 样本 ， 样 本 
中 最 小 的 断裂 临界 点 就 是 保证 的 断裂 临界 点 ， 即 这 一 批 中 至 少 90% 的 钢筋 会 以 95% 
的 概率 保持 完好 无 损 . E 
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例 3. 3. 3 
一 批 桶 是 用 来 安全 存放 有 放射 性 的 垃圾 ， 每 一 桶 都 标 有 所 含 放射 性 垃圾 的 量 ， 并 对 
此 进行 周期 性 的 检查 ， 从 中 随机 地 抽取 几 桶 并 从 外 部 扫描 ， 来 估计 桶 中 放射 性 垃圾 
的 含量 ， 估 计 值 与 桶 上 标签 的 值 相 比 较 得 到 差异 X， 过 了 3 个 月 的 周期 后 ， 用 这 种 
方法 检查 了 122 桶 ， 结 果 得 到 随机 变量 X,,…,X\,,， 其 中 X, 是 桶 上 标的 数量 和 扫描 
估计 量 的 差 值 . 

选取 上 下 限 X2 X” ( 即 r=2,m=2) 以 及 置信 水 平 95%. H (2) 式 得 到 落 
在 这 个 区 间 内 总 体 的 比例 ， 用 自由 度 为 2(r+m) =2(2+2) =8 的 x 分布 的 0.95 分 
位 数 ， 从 表 A2 中 查 得 为 15. 51. 


dn-2r+m-D)-_ -a _ 488 -6-15.51 0.938 
Ta kaya 3882641551 


我 们 可 以 有 95% 的 把 握 说 ，122 桶 中 至 少 有 93. 8% 的 桶 的 差异 在 第 二 小 观测 值 和 第 
二 大 观测 值 之 间 . m 
口 理 论 ”仔细 检查 单 边 容忍 限 所 做 的 表述 ， 可 以 发 现 它 与 单 边 分 位 数 置信 区 间 的 相 
似 性 ， 即 单 边 容 忍 限 指 的 是 : 
P( 总 体 至 少 有 4 的 比例 未 X S-a (4) 
BE, “AKEDA q 的 比例 <X"*”” 与 “总 体 q 分 位 数 <X"”” 是 一 样 的 ; 
这 两 种 表述 只 是 在 表述 想法 上 有 所 不 同 ， 所 以 ， 我 们 有 
P( 总 体 至 少 有 4 的 比例 过 Xo 1 
= P{( 总 体 9 分 位 数 迄 Xo+1 Im) = Pex £ X"+) (5) 
(5) 式 中 的 概率 在 (3.2.43) 式 中 已 给 出 


n-m | 
pix <£ Xt: > by 的 q'a E q'i (6) 
i=0 


检查 (6) 式 的 右边 发 现 ， 它 用 来 求 使 (6) 式 右 端 超过 1 -a 的 最 小 n， 这 个 可 以 通过 
在 表 A3 中 令 y =n-m， 参 数 p 等 于 q， 然 后 寻找 最 小 值 n， 使 得 其 值 大 于 等 于 1 -a H 
为 当 y 的 值 随 n 的 变化 而 变化 时 ， 为 方便 起 见 ， 将 (6) 式 的 右边 改写 为 


S o g'a = q)" =1— ç 的 q'(1 n "I ia (7) 
i=0 i=n-m+1 
是 可 以 的 ， 因 为 所 有 二 项 概率 的 和 等 于 1， 变化 (7) 式 右 端的 指标 j =n -i， 可 得 
nom fn ; 区 m—1 n iroun 
了 n 8 
S (wa q =1 > (e) 9)19 (8) 


(8) 式 从 事实 “nm -mm 或 更 少 次 数 成 功 的 概率 等 价 于 m 或 更 多 次 失败 的 概率 ， 它 等 于 
| 减 m - 1 次 或 更 少 次 失败 的 概率 ”中 立即 得 出 ， 结 合 (8) 和 (6) È, 我 们 可 以 找 
到 最 小 的 nx， 通 过 使 它 满足 
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m~1 
之 (7) (1 — q)" <a (9) 
j=0 


这 等 价 于 不 等 式 
m~l 
1 一 之 (r) (1-4)q"'i>1-_a (10) 
则 在 表 A3 中 , $y=m-1,p=1-q4, AARSE 8 TS Toa, 这 个 对 应 的 n 值 就 
是 所 选取 的 样本 容量 . 
另 一 个 单 边 容忍 限 是 


P( 总 体 中 至 少 有 4 的 比例 这 XIO) 这 1 一 a (11) 
等 价 于 下 式 
P(X SX)1~a (12) 
因为 总 体 至 省 有 1 -q 的 比例 大 于 等 于 x, (12) 式 就 成 为 
a >1 — PIXW< x,-) = P(xl < X”) (13) 


从 (3.2.41) 式 可 以 看 出 (13) BJ WS PL FARE) n 
二 H ini 
a> (i)a -0 (14) 
正如 (9) 式 那 样 . 
事实 上 ， 通 过 微 积 分 ( 见 Noether,1967a) 可 以 证 明 ， 对 双边 容忍 限 和 两 种 单 边 
容忍 限 ， 样 本 容量 n 依据 不 等 式 
rtm-1 


a> 之 的 (1 — qjq" (15) 


求解 . (15) 式 仅 依赖 于 r+ 普 的 和 ， 而 不 依赖 于 我 们 是 否 想 选 所 有 的 值 都 在 X U 
右边 的 区 间 ， 或 所 有 的 值 都 在 X"* ”左边 的 区 间 ， 或 所 有 值 都 在 X” 和 X”"* "之 
间 的 区 间 ， 或 由 任何 两 个 次 序 不 同 于 n+1 -m-r 的 次 序 统计 量 所 组 成 的 区 间 ， 这 有 
些 令 人 惊奇 . 

一 般 用 表 A3 解 (15 ) 式 是 无 效 的 ， 所 以 表 A5 和 A6 给 出 了 最 常用 的 r+m=1 和 
r+m=2 时 的 值 ，Scheffé 和 Tukey(1944 ) 不 加 证 明 地 给 出 了 (1) 式 的 逼近 ，(2) 式 可 
由 对 4 解 (1) 式 而 获得 .Murphy(1984) 和 Bimbaum 和 Zuckerman ( 1949 ) 给 出 用 图 形 
来 帮助 寻找 n. 口 

容忍 限 也 可 以 用 于 两 个 样本 (Danziger 和 Davis ,1964 ) ， 用 于 一 个 删 失 的 样本 
(Bohrer,1968) ， 或 用 于 判定 一 个 样本 来 自 两 个 可 能 的 多 元 总 体 的 哪 一 个 (Quesen- 
berry 和 Gessaman ,1968 ) Hanson 和 Owen(1963 ) 检验 了 容忍 限 在 离散 随机 变量 上 的 
使 用 ，Bowden(1968 ) 讨论 了 容忍 限 在 回归 问题 中 的 应 用 ，Mack(1969 ) 以 及 Goodman 
和 Madansky(1962 ) 发 表 了 其 有 关 容 忍 限 的 文章 ， 


习题 
l. 以 90 多 的 概率 认为 至 少 有 95% 的 总 体 落 在 样本 极 差 中 ， 则 需要 多 大 的 样本 量 ? 
(a) 用 精确 表格 . (b) 用 近似 方法 . 155 
2. 以 95% 的 把 握 说 至 少 有 90% 的 总 体 大 于 等 于 X ,需要 多 大 的 样本 量 ? 
(a) 用 精确 表格 . (b) 用 近似 方法 . 
3. ”使 得 至 少 有 85% 的 总 体 <X” 的 概率 为 0.90， 则 样本 量 必 须 是 多 少 ? 
(a) 用 精确 表格 . (b) 用 近似 方法 . 
4. ”使 得 至 少 有 99% 的 总 体 宇 X” 的 概率 为 95% ， 样 本 量 必须 是 多 少 ? 
(a) 用 精确 表格 . (b) 用 近似 方法 . 


5， ”至少 有 50 多 的 总 体 在 X2 和 X" “之 内 的 概率 为 0.90， 样 本 量 必须 是 多 少 ? 

6 习题 5 中 ， 如 果 把 概率 0. 90 换 为 0.95， 那 么 样本 容量 必须 是 多 少 ? 

7. ”健身 中 心 测量 了 86 个 会 员 的 含 脂肪 比例 . 

(a) 在 95% 的 概率 下 ， 样 本 中 86 个 会 员 的 含 脂 肪 比例 在 最 小 比例 和 最 大 比例 之 间 的 人 
数 比 例 最 小 是 多 少 ? 在 90% 的 概率 下 ， 情 况 如 何 呢 ? 

(b) 在 95% 的 概率 下 ， 样 本 中 86 个 会 员 的 脂肪 比例 在 X2 和 X 之 间 的 人 数 比例 最 小 
是 多 少 ? 在 90 多 的 概率 下 ， 情 况 如 何 呢 ? 

8.、 ”目录 邮购 公司 通过 平 信 调查 了 它 的 146 个 顾客 ,来 了 解 它 最 近 订 单 的 交 货 周期 (从 下 
订单 日 期 到 交付 日 期 ). 

(a) 在 95% 的 概率 下 ， 由 样本 观测 值得 到 的 顾客 期 望 邮递 时 间 在 XO A aI 之 间 的 比 
例 至 少 是 多 少 ? 对 90% 概率 的 情况 呢 ? 

(b) 注意 在 这 种 情况 下 容忍 区 间 的 端点 是 不 对 称 的 . 在 这 个 问题 中 用 这 些 不 对 称 的 端 
点 有 什么 优点 ? 

9. 某 工 程 师 记录 了 收 到 的 一 批 不 锈 钢 杆 的 规格 ， 发 现 至 少 90% 的 杆 长 在 她 随机 选 的 杆 长 
的 第 6 长 和 第 6 短 之 间 ， 为 了 得 到 这 个 表述 的 99 多 的 可 信和 度 ， 样 本 和 量 应 当 是 多 大 ? 

10. ”研制 了 一 个 计算 机 模型 来 模拟 战争 中 一 个 作战 单位 〈 例 如 一 个 通讯 中 心 ) ， 其 中 由 计算 
机 模型 决定 的 重要 一 项 ， 就 是 保持 作战 单位 满意 运转 水 平 的 最 少 人 数 . 我 们 希望 给 作 
战 单位 配备 足够 多 的 人 ， 使 得 90% 的 战斗 它 都 能 满意 地 运转 . 

(a) 计算 机 需要 运行 多 少 次 ， 才 能 使 得 我 们 有 99. 9% 的 把 握 说 需要 的 人 数 不 多 于 X”, 
运行 的 观测 值 的 最 大 数 是 多 少 ? 
(b) 计算 机 需要 运行 多 少 次 ， 才 能 使 得 我 们 有 99. 9% 的 把 握 说 需要 的 人 数 在 XU 和 
x” 之 了 ? 
(c) 计算 机 需要 运行 多 少 次 ， 才 能 使 得 我 们 有 99.97 的 把 握 说 需要 的 人 数 在 x HI 
TD 之 间 ? 
(d) 计算 机 需要 运行 多 少 次 ， 才 能 使 得 我 们 有 99.9% 的 把 握 说 需要 的 人 数 不 多 于 


= ? 


思考 题 
用 表 A3 求解 习题 3， 求 准确 的 a 值 . 
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3.4 符号 检验 


在 前 面 的 一 节 中 ， 我 们 的 主题 有 些 偏离 假设 检验 ,现在 重新 回来 讨论 最 古典 的 
非 参数 检验 ， 即 符号 检验 ， 实 际 上 ， 符 号 检验 就 是 参数 为 p” = 1/2 的 二 项 检验 .但 
是 ， 因 为 它 的 使 用 广泛 性 和 经 典 性 (可 追溯 到 1710 年 ) ， 符 号 检验 值得 更 特别 考虑 ， 
还 因为 p” =1/2 =1 -p*, 使 它 比 二 项 检验 更 加 简单 ， 符 号 检验 常用 于 检验 一 对 变量 
(X,Y) 中 的 一 个 随机 变量 是 否 比 男 一 随机 变量 大 ， 同时， 我 们 将 在 3.5 节 中 用 它 来 
检验 一 系列 次 序 度量 的 趋势 ， 或 检验 相关 性 ， 对 同一 模型 ， 在 很 多 可 以 用 符号 检验 
的 情况 下 ， 也 可 以 用 更 有 效 的 非 参 数 检 验 ， 但 是 符号 检验 通常 用 起 来 更 简单 和 方便 ， 
求 临 界 域 经 常 不 需要 特殊 的 表 . 


数据 ”数据 是 一 组 二 维 随 机 样本 (X,Y ) ,(X,,Y,),…, (Xn Y ) 的 观测 ， 其 中 有 n' 对 
观测 . 对 配对 观测 来 说 ， 应 当 有 某 个 自然 基础 ; 否则 XX 和 YY 是 独立 的 ， 这 时 更 适合 
使 用 第 5 章 更 有 效 的 Mann-Whitney 检验 . 

在 每 对 (X,Y,) ZEITER, WMR X<Y, wA “+” R “E”; UE X, > Y., 
记 为 “-", B “f”; WRX = Y, 记 为 “0” 或 “ 结 点 "， 因 此 只 需要 度量 是 次 
序 的 . 
假定 条 件 

1. 二 维 随机 变量 (X ,Y ) ,i=1,2,…,n'， 是 相互 独立 的 . 

2. 每 对 之 间 的 度量 尺度 是 须 序 的 . 即 每 对 (X, Y) 必定 是 “ 正 ”，“ 负 ”或 
“ 结 点 ”中 的 一 个 . 

3. (X,,Y,) 是 内 部 相 容 的 ， 因 为 如 果 对 于 一 对 (X,Y), # P( +)>P(-), 
那么 所 有 对 都 有 P(+)>P(-). P(+)<P(-) 和 PC+)=P(-) 的 情况 也 一 样 . 
检验 统计 量 ” 令 检 验 统计 量 了 为 “ 正 ” 的 对 数 ; BB T S£ DFY, É) (X,Y) 
对 数 . 

T =“+” 的 总 个 数 
零 分 布 的 零 分 布 服从 参数 为 p =1/2,n = 非 结 点 对 数 的 二 项 分 布 ， 即 不 考虑 所 有 
有 结 点 的 对 (XX,Y) ,其 中 (X=Y)， 且 令 

n 三 “+” 的 总 个 数 和 “-” 的 总 个 数 

假设 
A. (双边 检验 ) 

Ho: P(+) = P(—) 

Hi: P(+) # P(—) 
XIF n<20, Hip =1⁄2, ER A3 ， 在 表 中 选择 一 个 大 约 等 于 a/2 的 值 称 为 a, ， 对 应 
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Tea, 的 y 值 称 为 t 2a, 水 平 的 临界 域 对 应 着 了 值 小 于 等 于 t+， 或 大 于 等 于 -上 + 如 果 
Tst 或 T>n-t, Ú 2a, 的 显著 性 水 平 拒绝 H,, 否则 接受 Ho. 
xF n KF20, HR A3 最 后 的 正 态 通 近 ， 得 到 


t= n + za/2 V'n) (1) 
其 中 ，z > 由 表 Al 查 得 . 如 果 aw=0.05,z， =(-1.96),(1) 式 近似 变 成 
t=5- Vn (2) 


这 很 容易 记 住 . 

对 于 Y 小 于 等 于 观测 值 了 的 概率 及 Y 大 于 等 于 观测 值 了 的 概率 ，P- 值 是 2 (Ë T 
这 两 个 概率 中 的 较 小 者 ， 对 上 和 20， 它 可 以 从 表 A3 中 用 p =1/2 得 到 ,或 对 n > 20， 
从 表 Al 中 用 


2.fh 一 HL 十 1 
P(Y S tos) = p(z mt 1) (3) 


2.fwbs 一 所 一 =) 
Vr 


P(Y >t) =1 -p(z< 
n 


(4) 


获得 ， 其 中 ， 因 子 1.0 作为 “连续 性 修正 ”来 改进 二 项 分 布 的 正 态 分 布 通 近 效果 . 
B. (左边 检验 ) 
Ho: P(+) > P(—) 
Hi Per) < P(=) 
了 值 较 小 说 明 更 可 能 是 “ 负 ” 而 不 是 “ 正 ”， 符 合 H,. EK A3 中 用 p=1/2 和 
n， 查 表 得 到 的 近似 a 值 ， 比 如 是 w ， 则 对 应 于 a 的 y 值 就 是 上 当 n 大 于 20,t 可 以 
通过 下 面 的 近似 式 得 到 
t= (n + z, Vn) (5) 
其 中 ，z, 从 表 Al 中 获得 . 
KFa (sk a) 的 临界 域 对 应 着 了 值 小 于 等 于 上 如果 T<t， 则 以 显著 性 水 平 a 
(或 n>20 时 的 a) 拒绝 Ha, WWIK H,. 
p- 值 为 Y 小 于 等 于 观测 值 T 的 概率 ， 对 于 n<20， 用 p=0.5 可 以 从 表 A3 中 得 到 
E, 或 对 于 n>20, 用 G) Ñ, ERAI 中 查 得 . 
C. (右边 检验 ) 
Ho: P(+) < P(—) 
Hi: P(+) > P(—) 


较 大 的 了 值 说 明 更 可 能 是 “ 正 ” 而 不 是 “ 负 ”, EW H, 的 表述 . 所 以 临界 域 对 应 着 了 
值 大 于 等 于 n -:， 其 中 1 可 以 通过 在 表 A3 中 用 p=1/2 和 nn 去 查找 近似 等 于 a 的 值 (如 
左边 检验 的 情形 ) 而 得 到 ， 对 应 y 的 值 就 是 t 对 于 nn 大 于 20, 1 可 以 通过 (5) 式 近似 
得 到 ， 所 以 ， 如 果 了 大 于 等 于 n~t， 则 以 显著 性 水 平 a 拒绝 H. 
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pP- 值 为 Y 大 于 等 于 观测 值 了 的 概率 ， 对 n<20， 用 p=0.5， 它 可 以 从 表 A3 得 到 ， 
或 对 于 n>20, 用 (4) K, ÆR Al 中 获得 . 
应 当 注 意 ， 当 检验 这 些 假设 时 ,符号 检验 是 无 偏 和 相合 的 .符号 检验 也 可 以 用 
来 检验 下 面 的 其 他 假设 ， 在 这 种 情况 下 ， 除非 对 于 (X;,Y;) 的 分 布 有 限制 ， 否 则 既 
不 是 无 偏 的 也 不 是 相合 的 . 
A. (双边 检验 ) 
零 假设 为 “X, 和 Y, 有 相同 的 位 置 参 数 ”， 所 以 
Ho: E(X) =E(Y) ”对 于 所 有 的 i， 
对 备 择 假设 : 
Hi: E(X) # E(Y) ”对 于 所 有 的 i. 
A X, A Y, 是否 有 不 同 的 均值 ， 这 样 的 检验 也 可 类 似 地 用 于 对 中 位 数 的 检验 . 
Ho: 对 于 所 有 的 i,X; 和 YY, 的 中 位 数 相 等 
Hi: 对 于 所 有 的 i,X; 和 Y; 的 中 位 数 不 相 等 
B. (左边 检验 ) 
考虑 前 面 所 述 的 B 方法， 其 零 假设 表明 X, 的 取 值 倾向 可 能 比 Y, 来 得 小 ; 所 以 这 
个 单 边 符 号 检验 可 以 用 来 检验 
Ho: E(Xi) < E(Y) ”对 于 所 有 的 i 
对 备 择 假设 : 
Hi: E(X) > E(Y) ”对 于 所 有 的 i 
对 于 中 位 数 检验 也 有 类 似 的 假设 表述 . 
C. (右边 检验 ) 
HF H, 表明 X 很 可 能 大 于 YY; 而 不 是 小 于 Y,， 因 此 考虑 X, 的 取 值 趋向 大 于 Y, 
的 零 假 设 ， 所 以 这 个 单 边 符号 检验 有 时 用 来 检验 
Ho: E(X) Z E(Y) 对 于 所 有 的 ; 
对 备 择 假 设 : 
Pi:E(X)<EO5) ”对 于 所 有 的 i 
对 于 中 位 数 也 有 类 似 的 假设 表述 . 
计算 机 辅助 ”Minitab 和 StatXact 可 以 进行 符号 检验 ， 一 一 一 一 一 一 一 
例 3. 4. 1 
物品 A 通过 某 种 过 程 制 成 ， 物 品 B 和 A 有 同样 的 功能 ， 但 是 由 一 个 新 过 程 制 成 制 
造 商 想 知道 物品 B 是 否 更 受 消费 者 欢迎 ， 所 以 她 抽取 了 由 10 个 消费 者 组 成 的 随机 
样本 ， 给 他 们 每 人 一 个 A 和 一 个 B， 让 他 们 用 一 段 时 间 . 符号 检验 ( 单 边 ) 用 来 检 
验 
Ho: P(+) < P(—) 
对 备 择 假设 : 
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Hi: P(+) > P(—) 
其 中 ,“+” 代 表 事 件 “B 比 A 受 欢迎 ”,“ - ”代表 事件 “A 比 B 受 欢迎 ”. #4 
话说 ，H, 为 “B 不 比 A 倾向 受 欢迎 ”，H 为 “B HA 倾向 受 欢 迎 ”. 检验 统计 量 T 
是 “+” 号 的 个 数 ， 即 喜欢 B 消费 者 的 人 数 ， 临 界 域 对 应 着 工 值 大 于 等 于 n-t 但 
E, ER n 和 + 值 之 前 我 们 需要 知道 有 多少 个 结 点 . 
在 给 定 的 使 用 时 间 结 束 后 ， 消 费 者 给 出 他 们 对 物品 的 喜好 ，8 个 消费 者 喜欢 B, 
1 个 喜欢 A， 其 余 认为 “没有 差别 >， 所 以 
8 二 “+” 的 个 数 ”1 =“-” 的 个 数 1= 结 点 的 个 数 
R 一 “+”+“-” 的 个 数 =8+1=9 T=“+” 的 个 数 =8 
对 n=9， 在 表 A3 中 用 p=1/2， 查 找 近 似 等 于 0.05 的 值 ， 则 水 平 为 a, =0.0195 的 
临界 域 对 应 着 了 值 大 于 等 于 
n—t=9-1=8 
因为 T=8， 所 以 拒绝 H, p-fË P(Y=8) =0. 0195. 
制造 商 得 出 的 结论 是 消费 者 喜欢 B. m 
在 下 面 的 例子 中 ， 我 们 将 说 明 双 边 符 号 检验 中 大 样本 逼近 的 使 用 . 
例 3. 4. 2 
Arbuthnott(1710) 可 能 是 第 一 个 公开 出 版 的 非 参 数 检验 的 报告 ， 它 考查 了 伦敦 82 年 
来 每 年 的 出 生 记 录 ， 并 比较 了 每 年 出 生 的 男性 和 女性 的 数目 . 如果 对 于 每 一 年 我 们 
用 “+” 代 表 “ 出 生 的 男性 比 女性 多 " ， 反 之 用 “ - ”表示 (没有 结 点 )， 则 所 考 
虑 的 假设 为 : 
Ho: P(+) = P(—) 
Hi: P(+) # P(—) 
检验 统计 量 了 等 于 “+ ”号 的 个 数 ，a =0.05 水 平 的 临界 域 对 应 着 了 值 小 于 
t = 0.5(82 — (1.960) V82) = 32.1 
M T (Ë KT 
n — t = 82 — 32.1 = 49.9 
其 中 :用 (10) 式 计 算 . 
从 记录 中 ，Arbuthnott 得 到 了 82 个 “+ ”号 ,没有 “- ”号 ， 没 有 “ 结 点 ”. 
所 以 了 T=82， 并 且 拒 绝 零 假 设 ， 事 实 上 ， 可 以 在 更 小 的 a 水 平 
P(T = 0) + P(T = 82) = (b° + H? = H” 
下 拒绝 H, ERE p- 值 . [i 
为 了 看 到 符号 检验 的 更 多 用 途 ，K. Schmidt-Koenig 向 Batschelet (1965) 介绍 了 下 
面 的 例子 . 
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例 3. 4. 3 
把 10 只 信 铝 带 到 它们 钢 笼 以 西 25 公里 的 地 方 ， 逐 个 放飞 ， 看 它们 是 随机 向 各 个 方向 


飞 ( 零 假设 )， 还 是 会 向 朝 着 它们 窒 的 东方 飞 、 用 固定 的 野外 望远镜 观察 久子 直到 它 
们 飞 离 视 线 ， 同 时 记录 消失 点 的 角度 ， 这 10 个 角度 为 : 20,35 ,350,120 ,85 ,345 ,80， 
320 ,280 ,85 度 ， 令 “+” 表示 更 偏 东 的 方向 (0 到 90 度 或 270 到 360 E), “-” RIR 
远离 窝 的 方向 (90 度 和 270 EZE). 假设 

Ho: P(+)< P(-) 

Hi: P(+)> P(—) 
正 是 C 部 分 的 右边 检验 ， 所 以 临界 域 对 应 着 大 的 T 值 ， 其 中 T 为 “+” 的 个 数 . 在 A3 
中 用 p=1/2 和 n=10,a =0. 0547 水 平 的 临界 域 对 应 着 的 T 值 大 于 等 于 10 -2 =8. 

对 这 些 数据 ， 可 得 T=9， 所 以 拒绝 零 假 设 ， 结 果 是 这 些 信和 钼 趋向 于 飞 回 家 而 不 

是 随机 地 乱 飞 ，P- 值 是 P(T>9) =0. 0107. m 
口 理 论 事件 “ +” 代表 事件 “Y, >X”, sk “Y, -成 >0"， 即 是 说 差 Y, -X 是 正 
的 ， 类 似 地 ,“-” 和 “0” 分 别 代表 事件 Y - X 是 “ 负 ” 的 或 “ 零 ”. 所以， 符号 


检验 是 用 来 比较 差 为 正 数 的 概率 和 差 为 负数 的 概率 的 检验 .在 二 项 检验 中 ， 这 些 分 
别 被 称 为 “类 1” 和 “类 2” 概 率 . 忽略 结 点 ， 我 们 有 


P(+) + P(-)=1 
所 以 假设 
Ho: P(+) = P(—) 
这 等 价 说 
Ho: P(+) = 1/2 


它 与 p* = 1⁄2 时 ， 二 项 检验 的 形式 是 一 样 的 ， 所 以 用 同样 的 二 项 检验 方法 ， 从 下 面 
的 对 称 性 ， 
p*=1/2=1-p* 

可 以 得 到 简化 结果 .， 当 符号 检验 用 于 检验 A,B,C 部 分 的 假设 时 ， 符 号 检验 是 无 偏 和 
相合 的 ( 见 Hemelrijk,1952)， 例 2. 4.2 解释 了 p=1/2 的 二 项 检验 ， 和 没有 结 点 的 符 
号 检验 是 一 样 的 ， 所 以 图 2-4 中 所 画 的 功效 函数 就 是 符号 检验 的 功效 函数 .虽然 没 有 
证 明 , 但 从 这 些 图 中 很 明显 得 出 ， 符 号 检验 是 无 偏 和 相合 的 . 口 

如 果 我 们 对 符号 检验 加 上 另外 的 假定 ， 即 假设 差 Y -成 是 具有 对 称 分 布 的 随机 
变量 [如果 对 于 所 有 x， 有 P(Z<c-x*) =P(Z>c+x)， 则 称 随机 变量 Z 的 分 布 函 数 
关于 c 点 对 称 ] Wilcoxon 符号 秩 检验 是 更 适合 的 ( 见 5.7 节 ). 进一步 讲 ， 如 有 果 差 
Y, -X 是 独立 同 分 布 的 正 态 随机 变量 ,合适 的 参数 检验 称 为 成 对 检验， 在 这 种 情况 
下 ， 与 成 对 1 检验 相 比 ，A. R. E. 只 为 2/r =0.637， 同 样 与 Wilcoxon 符号 秩 检验 相 
E, ARE 为 2/3， 如 果 差 有 均匀 分 布 ( 轻 尾 分 布 )， 则 符号 检验 的 A. R. E. 相对 
于 + 检验 或 Wilcoxon 检验 则 降 至 1⁄3 =0.333. 对 于 对 称 的 重 尾 分 布 ， 如 我 们 所 知 的 
双 指 数 分 布 ， 符 号 检验 的 A. R. E 相对 于 :检验 和 Wilcoxon 符号 秩 检 验 分 别 升 到 2.0 
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和 4/3 = 1. 333. 

Walsh( 1951 ) ,Dixon( 1953 ) , Hodges 和 Lehmann ( 1956 ) 以 及 Gibbons ( 1964 ) 还 有 
其 他 人 研究 了 大 样本 和 小 样本 情况 的 效率 . MacKinnon ( 1964) 给 出 了 样本 量 直 到 1000 
的 特殊 表 ，Hemelrijk(1952 ) 讨论 了 结 点 的 情况 . 

像 符号 检验 一 样 ， 当 数据 成 对 出 现时 ， 我 们 可 以 通过 减少 序列 对 变 成 单 值 序 列 来 
分 析 ， 好 像 只 有 一 个 样本 一 样 ， 即 用 单 变量 方法 来 分 析 两 变量 样本 ， 在 符号 检验 中 ， 可 
采用 分 析 一 系列 值 的 相同 方式 来 分 析 差 Y, - X,， 看 正 值 是 否 比 负 值 多 需要 记 住 这 种 
降 二 维 (甚至 多 维 ) 数据 为 单 变量 样本 的 法 则 ， 这 是 很 有用 的 . 
习题 
l. 6 个 学 生 想 通 过 节食 减肥 ， 有 如 下 结果 : 

姓名 Abdul Ed Jim Max Phil Ray 
节食 之 前 体重 174 191 188 182 201 188 
节食 之 后 体重 165 18 183 178 203 181 

节食 是 减肥 的 有 效 方法 吗 ? 

2. 比较 了 一 组 28 名 办 公 室 职员 的 午饭 前 和 午饭 后 的 反应 时 间 ， 发 现 22 名 职员 午饭 前 的 反应 

时 间 更 短 ，2 人 没有 区 别 ， 午饭 后 的 反应 时 间 显 著 比 午饭 前 长 吗 ? 

3. 比较 两 种 不 同 的 添加 剂 来 看 哪 一 种 能 更 好 地 改进 混凝土 的 耐 抗力 .将 100 小 批 的 混凝土 

在 不 同 条 件 下 混合 ， 混 合 时 每 批 分 为 两 部 分 ， 一 部 分 要 加 入 添加 剂 A， 另 一 部 分 则 加 入 

B. 等 到 混凝土 变 硬 后 ， 每 批 的 两 部 分 互相 挤 压 ， 由 一 个 观察 员 决 定 哪 一 部 分 更 耐 抗 ， 在 

77 种 情况 下 A 相对 更 耐 抗 ， 23 种 情况 下 B 相对 更 耐 抗 ， 问 两 种 添加 剂 的 耐 抗 效果 有 显著 

差异 吗 ? 

4. 邀请 在 杂货 店 的 22 名 顾客 品尝 两 种 干酪 并 选 出 喜欢 的 品种 .7 名 顾客 喜欢 其 中 的 一 种 ， 

12 名 喜欢 另 一 种 ，3 名 没有 特别 的 偏好 . 这 能 说 明 顾 客 有 明显 的 偏好 吗 ? 

5 一 名 妇 产 科 医 生 认为 晚上 ( F 6 点 到 早晨 6 点) 比 白 天 出 生 的 婴儿 多 , 但 是 他 的 一 位 

统计 学 家 朋友 说 这 只 是 一 种 可 能 ， 第 二 年 他 们 跟踪 记录 了 所 有 在 这 个 医生 照顾 下 自然 生 

产 婴 儿 的 时 间 ， 来 看 谁 是 对 的 . 结果 是 


午夜 至 凌晨 3 点 一 一 16 例 中 午 至 下 午 3 点 一 一 10 f 

凌晨 3 点 至 6 点 一 一 17 例 下 午 3 点 至 6 点 一 一 11 fJ 

早上 6 点 至 9 点 一 一 12 例 下 午 6 点 至 9 点 一 一 12 例 

上 午 9 点 至 中 午 一 一 9 例 晚上 9 点 至 午夜 一 一 15 例 
问 统 计 学 家 是 对 的 吗 ? 


6. 在 实验 室 里 ， 把 某 种 昆虫 放 在 一 个 平 桌子 中 间 所 画 的 圆圈 内 ， 在 桌子 的 一 边 放 一 种 香水 
吸引 这 种 昆虫 ， 逐 个 释放 每 只 昆虫 ， 在 一 定时 间 内 观察 它们 是 否 穿 过 圆圈 的 边 ， 如 果 穿 
过 圆圈 的 边 ， 则 记录 下 昆虫 是 朝 香 气 方 向 的 半圆 走 还 是 朝 远 离 香气 的 半圆 走 ， 在 合理 的 
时 间 内 ， 试 验 结果 是 : 61 只 昆虫 中 有 33 只 向 香气 的 方向 走 ，16 只 向 远离 香气 的 方向 走 ， 
12 只 没有 穿 过 圆圈 ， 问 香水 吸引 这 些 昆 贝 了 吗 ? 
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思考 题 


如 果 在 水 平 a =0. 05 HNA R FAES M, W : 值 可 以 用 (1) 式 近 似 计算 出 : 
tı = #(n — 1.9600 Vn) 
或 近似 为 
h = n — Vn 
例如 ， 如 果 n=21,t, =6.009,;, =5.917， 所 以 ， 第 一 个 临界 域 包含 整 数 6， 但 是 第 二 个 则 
不 包含 整数 6， 两 个 等 式 得 出 了 不 同 的 临界 域 . 对 20 到 30 内 的 哪些 n， 两 个 等 式 能 得 出 
同样 的 检验 ? 这 两 个 结果 是 否 都 等 价 于 n =16 的 情形 ? 


3.5 符号 检验 的 一 些 变形 


假定 符号 检验 中 的 数据 不 是 有 序 的 ， 而 是 具有 分 别称 为 “0” 和 “1” 两 种 类 别 
的 名 义 数据 ， 即 每 个 成 或 者 是 0 或 者 是 1， 每 个 Y, 也 一 样 ， 那么 有 时 要 问 “ 我 们 能 
发 现 (0,1) 的 概率 和 (1,0) 的 概率 之 间 的 差异 吗 ?” 当 X, 在 (X,Y;) 中 代表 试验 
以 前 的 科目 条 件 ( 或 状态 ) Y 代表 同样 科目 试验 后 的 条 件 时 ， 这 样 的 问题 就 出 现 
了 .在 符号 检验 中 使 用 的 方法 这 里 同样 可 以 使 用 ， 只 不 过 检验 的 名 字 有 所 不 同 . 


也 改变 显著 性 的 McNemar 检验 


数据 ”数据 由 xn' 个 独立 的 二 维 随机 变量 (X,Y;) ,i=1,2,…,n' 组 成 ， 这 里 X, 和 ,的 
度量 尺度 是 名 义 的 ， 分 别 具 有 “0”,“1” 两 个 类 别 ; EH (X,,Y,) 的 可 能 值 为 (0,0)， 
(0,1),(1,0) 和 (1,1). 在 McNemar 检验 中 ,数据 常 归结 为 如 下 的 2 x2 的 列 联 表 
(contingency table ). 


Y, 的 分 类 
Y=1 


Y = 0 
a (X,=0 Al Y=0 b(X,=0 Ñ Y=1 
的 对 数 ) 的 对 数 ) 
c(X=1 和 Y=0 d(X;=1 和 Y=1 
的 对 数 ) 的 对 数 ) 
假定 条 件 


1. 数 对 (X,Y,) 是 相互 独立 的 . 

2. 对 所 有 X, 和 Y, ,度量 尺度 是 具有 两 个 类 别 的 名 义 尺度 . 

3. 差 值 P(X, =0,Y =1) -P(X,=1,Y,=0) 或 者 对 于 所 有 i 为 负 ， 或 者 对 于 所 有 i 
为 零 ， 或 者 对 于 所 有 i 为 正 . 
检验 统计 量 McNemar 检验 统计 量 通常 写 为 
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(1) 


但 是 ， 对 于 b+c<20， 则 选用 下 面 的 统计 量 


T. =b (2) 


注意 ，7T ,7 都 不 依赖 于 a 或 4， 这 是 因为 a 和 4 代表 “ 结 点 ”的 个 数 ， 而 这 里 的 分 
析 不 考虑 结 点 . 
零 分 布 4 (b+c) RAR, T, 的 零 分 布 近似 于 自由 度 为 1 的 x at, T, 的 精确 分 
布 是 p=1/2,n=b+c 的 二 项 分 布 . 
假设 

Ho: P(X; = 0,Y;=1)= P(X;=1,Y;=0) 对 于 所 有 的 i 

Hi: P(X; = 0, Y; = 1) # P(X;=1,Y;=0) ”对 于 所 有 的 i 
如 果 我 们 将 P(X, =0,Y =0) 加 到 H, 中 等 式 的 两 边 ， 这 些 假设 的 形式 会 有 所 不 同 ， 即 

Ho: P(X; = 0, Y; = 1) + P(X; = 0, Y; = 0) = P(X; = 1, Y; = 0) + P(X; = 0, Y; = 0) 


H, 的 左边 包括 所 有 Y, 的 概率 ， 因 此 等 于 P(X =0)， 同样，H, 的 右边 包括 所 有 X, 的 
概率 ， 所 以 等 于 P(Y =0)， 从 而 我 们 有 如 下 新 形式 的 假设 
Ho:P(X =0)=P(Y;=0) ”对 于 所 有 的 i 
Hy: P(Xi=0)# P(Yi=0) ”对 于 所 有 的 i 
当然 ， 这 也 等 价 于 
Ho: P(X;=1) = P(Y;=1) ”对 于 所 有 的 i 
HH: P(X;=1)# P(Y;=1) ”对 于 所 有 的 i 
而 后 面 的 假设 形式 在 试验 中 更 易于 解释 . 
令 n 等 于 b+c， WMR n20, HE A3. WR a 是 理想 的 显著 性 水 平 ， 在 表 A3 中 
用 n=b+c 和 p=1/2 找到 近似 等 于 a/2 的 值 ， 称 这 个 值 为 a, ， 相 应 的 y 称 为 上 如 
果 T,<t, 或 Tn-t， 则 以 2a 的 显著 水 平 拒绝 H,， 否 则 接受 BH,，p- 值 是 2 倍 于 也 
小 于 等 于 观测 值 的 概率 和 了 T 大 于 等 于 观测 值 的 概率 中 的 较 小 者 ， 其 概率 值 可 在 表 A3 
中 用 p =1/2,n=b+c 获得 . 
如 果 n 超过 20， 用 T, 和 表 A2， 所 以 如 果 T 超过 自由 度 为 1 的 x 分 布 的 (1 -a) 
分 位 数 ， 则 以 a 的 显著 性 水 平 拒绝 及 ， 否 则 接受 H,.，p- 值 是 7T, 大 于 观测 值 的 概率 ， 它 
可 利用 自由 度 为 1 的 x 分 布 在 表 A2 中 获得 ， 更 严格 的 p- 值 可 以 通过 比较 T, 的 负 平 方 
RAK Al 而 得 到 ， 并 且 左 边 概率 变 成 了 2 售 . 
计算 机 辅助 S-Pluss ，StatXact 和 SAS 可 以 进行 McNemar 检验 ， 一 一 一 一 
例 3.5.1 
在 两 个 总 统 候选 人 的 全 国电 视 辩 论 之 前 ， 抽 取 了 一 个 有 100 人 的 随机 样本 ， 他 们 对 
候选 人 的 选择 如 下 ，84 个 选民 主 党 候选 人 ， 剩 余 的 16 个 选 共和 党 候选 人 ， 在 辩论 
之 后 ， 又 收集 了 这 100 个 人 的 选择 ， 之 前 选择 民主 党 候选 人 的 人 中 有 1/4 改 变 了 主 
意 ， 同 样 之 前 选 共 和 党 的 人 有 1⁄4 改选 民主 党 候选 人 ， 结 果 总 结 为 如 下 的 2 x2 的 列 
联 表 ， 


[167] 
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之 前 


x | +é | n | w 
100 

McNemar 检验 可 以 用 来 检验 H,: 选民 总 体 不 受 辩论 影响 ， 备 择 假设 H .: 在 选 
民 中 选民 主 党 人 的 比例 会 有 变化 ， 如 果 第 i 个 人 之 前 选民 主 党 ， 就 认为 (X,Y,) 中 
的 X, 为 0; 如 果 选 共和 党 就 认为 X 为 1。 类 似 地 ，Y, 代表 第 i 个 人 在 辩论 之 后 的 选 
择 (我 们 是 否 选 择 用 0 或 1 代表 对 民主 党 的 选择 不 影响 结果 ， 只 要 X, 和 用 同样 
的 表达 即 可 ). McNemar 检验 统计 量 T, 为 
E a A ei a 


ampri FFl 
289 
= = 11.56 (3) 


a =0. 05 水 平 的 临界 域 对 应 着 所 有 T, 值 大 于 3. 841 (自由 度 为 1 的 x 分 布 的 0.95 分 
位 数 ， 可 从 表 A2 中 查 到 ). 因为 11. 56 大 于 3. 841， 所 以 拒绝 零 假 设 ， 结 论 是 选民 
的 队伍 有 所 改变 ， 且 p- 值 小 于 0. 001. m 
口 理论 ”这 是 一 个 符号 检验 的 变形 ， 其 中 事件 (0,1) RA <+”, 事件 (1,0) 称 为 
“-”, 事件 (1,1) 和 (0,0) 称 为 结 点 ， 则 McNemar 假设 检验 的 形式 取 为 
Ho: P(+)= P(-) 

这 和 双边 符号 检验 时 的 H, 一 样 ， 的 临界 域 与 符号 检验 n<20 的 情况 一 样 . 

对 于 nn 大 于 20， 建议 用 正 态 允 近 的 符号 检验 ， 这 是 因为 当 到 为 真 时 ， 如 下 表 


达 式 
Ta- n) b—n(}) (4) 


近似 地 服从 标准 正 态 分 布 ( 见 习题 1.5.6). 因为 n=b+c, (4) 式 化 简 为 
_b- [b+ c) /2] 


° (0) Vb+c 


“Vore (6) 
所 以 


近似 地 服从 自由 度 为 1 的 x 分 布 〈 见 定理 1.5.3)， 一 个 包括 也 或 Z 的 双边 检验 的 临 
界 域 可 以 与 用 T, = Z° 的 上 尾 作为 临界 域 相 比 . 口 
由 于 已 经 介绍 了 符号 检验 的 单 边 和 双边 形式 ， 所 以 McNemar 检验 也 有 这 两 种 形 
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式 . 给 出 单 边 形式 McNemar 检验 的 最 简单 方法 就 是 用 单 边 符号 检验 ，Bennett 和 
Underwood ( 1970 ) , Ury ( 1975 ) , Mantel 和 Fleiss ( 1975 ) , 和 Mckinlay ( 1975 ) 讨论 了 
McNemar 检 验 和 它 的 变形 . 

Cox 和 Stuart ( 1955) 介绍 了 符号 检验 的 另 一 种 修正 形式 ， 用 它 来 检验 某 种 趋势 
(trend) 的 出 现 ， 一 列 数 如 果 后 面 的 数 比 前 面 的 数 趋 于 变 大 (上 升 趋势 ) 或 比 前 面 的 数 
趋 于 变 小 〈 下 降 趋势 ) ， 则 称 为 是 有 趋势 的 ， 这 个 检验 将 后 面 的 数 和 前 面 的 数组 成 对 ， 
并 在 所 形成 的 对 上 进行 符号 检验 .如果 有 趋势 ， 则 每 对 中 的 一 个 数 比 另 一 个 数 有 变 大 或 
变 小 的 趋势 ; 另 一 方面 ， 如 果 没 有 趋势 ， 这 列 数 实 际 上 代表 独立 同 分 布 的 随机 变量 的 观 
测 ， 每 一 对 中 的 任 一 个 数 都 没有 超过 另 一 个 的 趋势 . 


> Cox 和 Stuart 趋势 性 检验 


数据 数据 由 随机 变量 序列 X ,X,,…,X, 的 观测 值 组 成 ， 以 某 种 顺序 排列 ， 例 如 观测 
的 顺序 ， 我 们 希望 知道 这 个 数列 中 是 否 有 趋势 存在 ， 把 随机 变量 进行 配对 分 组 (成 ， 
X (2 ,XX ) ,…,(X,,_.,X,) ,其 中 如 果 半 是 偶数 ， 则 c= n /2, WR nn' 是 奇数 ， 
则 c=(n’+1)/2. (注意 用 这 种 方案 时 ， 如 果 n' 是 奇数 要 除去 中 间 的 随机 变量 )， 如 
RX < X,.., WMA “ +" RE (XX,X,,。)， 如 果 X >X,., WJ “-" K (X,, 
X,,.) ， 而 不 考虑 结 点 ， 没 有 结 点 对 的 个 数 称 为 n. 

这 个 检验 可 以 用 来 检测 任何 给 定 的 非 随机 模式 ， 如 正弦 波 或 其 他 周期 模式 ， 随 
机 变量 列 只 是 重新 排列 从 而 使 得 最 小 的 数 〈 像 预期 的 那样 ) 靠近 数列 的 开始 ， 较 大 
的 数 靠 近 数 列 末尾 ， 则 排列 后 数列 出 现 上 升 趋势 预示 着 原 数列 中 有 某 种 预期 的 模式 . 
假定 条 件 

1. 随机 变量 X, ,X,,…,X 是 互相 独立 的 . 

2. X, 的 度量 尺度 至 少 是 须 序 的 . 

3. X, 是 同 分布 或 有 某 种 趋势 ， 即 后 面 的 随机 变量 更 可 能 比 前 面 的 大 (或 反之 
亦 然 ). 
检验 统计 量 T=“+” 的 个 数 
零 分 布 ”统计 量 的 零 分 布 是 p =1/2,n = 没有 结 点 对 数 的 二 项 分 布 ， 其 中 X; 不 等 于 
X,,.- 
假设 ”检验 的 其 他 部 分 和 前 面 所 述 的 符号 检验 是 一 样 的 ， 这 里 不 重 述 了 . 和 零 假设 : W 
有 出 现 趋 势 ， 右 边 单 边 检 验 可 用 于 检测 上 升 趋势 ; 左边 检验 可 用 于 检测 下 降 趋 势 ; 而 双 


边 检验 可 用 于 检测 存在 任何 (上升 或 下 降 ) 趋势 的 备 择 假设 . 一 一 一 一 < 
下 面 是 用 到 双边 Cox 和 Stuart 趋势 性 检验 的 例子 . 
例 3. 5. 2 


有 19 年 的 每 年 降水 量 的 记录 .， 检查 这 个 记录 来 看 降水 量 是 否 有 增加 或 减少 的 趋势 . 
降水 量 (以 英寸 为 单位 ) 分 别 是 45. 25 ,45. 83 ,41. 77 ,36. 26 ,45. 37 ,52. 25 , 35. 37， 
57. 16 ,35. 37 ,58. 32 ,41. 05 ,33. 72 ,45. 73 ,37. 90 ,41. 72 ,36. 07 ,49. 83 ,36. 24 和 39. 90. 
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因为 n' =19 是 奇数 ， 去 掉 中 间 的 数 58. 32， 把 剩 下 的 数组 成 对 . 
(45.25, 41.05) (45.37,41.72) — (4.5.83,33.72) 
(52.25, 36.07) (41.77, 45.73) — (3.5.37,49.83) 
(36.26, 37.90)  (57.16,36.24) (35.37, 39.90) 
BHAA, MA n =9. 检验 统计 量 了 等 于 第 二 个 数 大 于 第 一 个 数 的 数 对 个 数 , 
0. 0390 水 平 的 临界 域 对 应 着 了 小 于 等 于 1 和 了 7 大 于 等 于 9 -1=8 的 值 . 
代入 数据 ， 得 到 了 =4， 它 在 接受 域 中 ， 且 p- 值 等 于 1.0， 所 以 接受 零 假设 “ 没 
有 趋势 存在 ”. mi 
在 例 3. 5. 2 中 ， 对 于 检验 为 有 效 的 模型 假设 是 合理 的 ， 所 以 检验 是 合理 有 效 的 . 
但 是 ， 所 列 假设 不 都 是 必要 的 ， 我 们 的 假设 只 需 能 满足 符号 检验 的 模型 就 足够 了 . 
即 只 需要 假设 : 
1. 随机 变量 X, X... X, ,是 互相 独立 的 . 
2. 对 于 所 有 的 对 ， 概 率 P(X, <X,,。) 和 概率 P(X, >X,,。) 有 同样 的 相对 大 小 . 
3. 每 对 (Xi,X,,.) 能 够 判别 为 ”+”,”- 或“ 结 点 . 
这 些 假设 不 像 检 验 中 所 给 的 系列 假设 那样 容易 理解 ， 但 是 在 很 多 实际 问题 中 它 
们 更 有 用 ， 例 如 下 面 的 例子 . 
例 3.5.3 
24 个 月 中 ,记录 了 某 条 小 溪 每 月 的 平均 水 流速 度 (单位 : 立方 英尺 / 秒 )， 要 检验 的 
假设 是 : 
Ho: 平均 水 流速 度 没有 降低 
备 择 假设 : 
H): 平均 水 流速 度 降低 了 
我 们 知道 水 流速 度 是 以 年 为 周期 的 ， 所 以 将 两 个 不 同月 的 水 流速 度 配 对 是 无 济 于 事 的 . 
但 是 ， 将 连续 两 年 的 同一 个 月 配对 ， 这 样 可 以 进行 趋势 性 研究 ， 收 集 数据 如 下 : 


月 份 第 一 年 第 二 年 月 份 第 一 年 第 二 年 
一 月 14.6 14.2 七 月 92.8 88.1 
=H 12.2 10.5 八 月 74.4 80.0 
三 104 123 九 月 75.4 75.6 
月 220 190 十 月 51.7 48.8 
五 月 110 138 十 一 月 29.3 27.1 
六 月 86.0 98.1 十 二 月 16.0 15.7 


检验 统计 量 了 等 于 第 二 年 流速 比 第 一 年 高 的 对 数 ， 本 例 中 T=5， 因 为 是 检验 下 降 趋 
势 ，0. 0730 水 平 的 临界 域 对 应 着 所 有 了 小 于 等 于 3 (从 表 A3 中 , 用 n=12,p=1/2 
获得 的 值 )， 所 以 接受 HH,,p- 值 为 
P(T 和 5| Bo RI ) = 0.3872 
这 个 值 太 大 ， 以 至 于 是 一 个 不 能 接受 的 a. m 
这 一 节 中 的 例子 只 能 代表 符号 检验 所 适用 的 不 同 假设 检验 的 一 小 部 分 ， 再 
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用 两 个 例子 来 结束 这 一 节 . 对 第 一 个 例子 符号 检验 作为 检验 相关 性 的 一 个 简单 
方法 ， 即 检验 一 个 随机 变量 的 较 大 值 是 否 趋 向 于 和 第 二 个 随机 变量 的 较 大 值 配 
对 ， 而 较 小 值 和 较 小 值 配对 ( 正 相 关 ) ， 或 一 个 随机 变量 的 较 大 值 是 否 趋向 于 和 
第 二 个 随机 变量 的 较 小 值 配 对 ， 而 较 小 值 和 较 大 值 配 对 ( 负 相 关 ). 检验 包括 排 
数 对 ( 数 对 伴随 不 变 ) 使 得 数 对 中 的 一 个 数 (通常 是 结 点 较 少 的 变量 ， 第 一 个 
或 第 二 个 变量 ) 的 顺序 是 递增 的 .如果 有 相关 性 ， 数 对 中 的 另 一 个 数 将 会 呈现 
出 趋势 性 ， 如 果 是 正 相 关 就 是 上 升 趋 势 ， 如 果 是 负 相 关 就 是 下 降 趋势 .Cox 和 
Stuart 趋势 性 检验 就 可 用 于 由 数 对 中 男 外 一 个 数 形成 的 数列 上 . 

例 3. 5. 4 

Cochran( 1937 ) 比较 了 一 些 病 人 对 两 种 药 的 反应 ， 来 说 明 每 个 病人 对 两 种 药 的 反应 


是 否 有 正 相 关 性 . 
病人 药物 1 药物 2 病人 药物 1 药物 2 
1 +0.7 +1.9 6 +3.4 +4.4 
2 一 1.6 +0.8 7 +3.7 +5.5 
3 -0.2 +1.1 8 +0.8 +1.6 
4 -1.2 +0.1 9 0.0 +4.6 
5 -0.1 —0.1 10 +2.0 +3.4 


根据 对 第 一 种 药物 的 反应 对 数 对 排序 得 到 : 
病人 药物 1 药物 2 病人 药物 1 药物 2 


2 一 1.6 十 0.8 1 +0.7 十 1.9 
4 一 1.2 +0.1 8 +0.8 +1.6 
3 一 0.2 十 1.1 10 十 2.0 十 3.4 
5 —0.1 一 0.1 6 +3.4 +4.4 
9 0.0 +4.6 7 +3.7 +5.5 


把 单 边 的 Cox 和 Stuart 趋势 性 检验 用 于 新 排序 后 药物 2 的 数列 上 ， 产 生 了 5 个 数 对 
38: ( +0.8, +1.9),( +0.1, +1.6),( +1.1, +3.4),( -0.1, +4.4),( +4.6, 
+5.5). 因为 我 们 检验 : 

Ho: 没有 正 相 关 性 
备 择 假设 : 

Hi: 有 正 相关 性 

本 质 上 ， 我 们 要 检验 上 升 趋势 (已 ) ， 检 验 统计 量 了 等 于 5$， 因 为 在 所 有 5 对 数据 中 
药物 2 的 第 二 个 观测 超过 了 第 一 个 观测 ，0. 0312 (对 n=5,p =1/2 AK A3 中 ， 并 
得 t=0) 水 平 的 临界 域 对 应 于 单 值 T=5， 所 以 拒绝 零 假 设 ， 从 而 可 得 出 对 两 个 药物 
的 反应 有 正 相 关 性 ， 本 例 中 的 p-fË tB, F 0. 0312. = 


最 后 的 一 个 例子 用 于 解释 符号 检验 或 Cox 和 Stuart 趋势 性 检验 怎样 检验 预期 的 
模式 . 
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例 3. 5. 5 
在 一 个 24 小 时 的 试验 中 ， 以 小 时 为 单位 记录 实验 室 中 的 一 群 昆虫 产 卵 的 数量 ， 要 
检验 

Ho: 24 个 产 卵 数量 组 成 24 个 同 分 布 随机 变量 的 观测 值 . 


备 择 假设 

Hi: 产 卵 数量 在 下 午 2:15 达到 最 小 ， 逐 渐 增 加 直到 凌晨 2:15 增 大 到 最 大 值 ， 青 减少 直到 下 午 2:15. 

每 小 时 产 卵 数量 的 记录 如 下 

时 间 $p 65 3 + 时 间 phx “时间 卵 的 数量 

上 午 9 点 151 下 午 5 点 83 J 1 PA 286 
+kea9dF$aəaon0n 点 119 晚上 6 点 166 ŽR2Ä 235 
上 午 11 点 146 有 晚上 7 点 143 ”凌晨 3 点 223 
中 午 12 点 111 晚上 8 点 116 ”法 晨 4 点 176 
下 午 1 点 63 晚上 9 点 163 凌晨 5 点 176 
下 午 2 点 84 晚上 10 点 28 早上 6 点 174 
下 午 3 点 60 Be F 11 点 283 上 午 7 点 139 
下 午 4 点 109 晚上 12 点 296 上 午 8 点 137 


如 果 备 择 假设 成 立 ， 卵 的 数量 在 离 下 午 2:15 最 近 时 应 当 趋 于 最 少 ， 凌 晨 2:15 附近 
应 当 趋 于 最 多 .所 以 ,根据 时 间 从 下 午 2:15 左右 到 凌晨 2:15 左右 重新 排列 卵 的 
数量 . 


时 间 5 65 3 + 时 间 $P 5 3⁄ a 
下 午 2 点 84 L#8 8 137 
下 午 3 点 60 晚上 9 点 163 
下 午 1 点 63 上 午 7 点 139 
下 午 4 点 109 晚上 10 点 208 
中 午 12 点 111 早上 6 点 174 
下 午 5 点 83 晚上 11 点 283 
上 午 11 点 146 凌晨 5 点 176 
晚上 6 点 166 晚上 12 点 296 
上 午 10 点 119 凌晨 4 点 176 
晚上 7 点 143 凌晨 1 点 286 
上 午 9 点 151 凌 展 3 点 223 
晚上 8 点 116 凌晨 2 点 235 


WEH, 成 立 ， 这 些 数据 应 当 呈 现 出 上 升 趋势 ， 用 单 边 Cox 和 Stuart 趋势 性 检验 ， 用 数 
列 的 前 一 半 (第 一 列 ) 与 数列 的 后 一 半 (第 二 列 ) 配对 ， 则 每 一 行 上 的 产 卵 数 形成 一 
个 数 对 ， 在 全 部 的 12 对 中 ， 第 二 列 的 数 都 大 于 第 一 列 ， 所 以 了 =12. 对 于 n=12,p = 
1⁄2, EK A3 PAH a =0. 0193 水 平 的 临界 域 对 应 着 了 值 大 于 等 于 12 -2 =10， 所 以 拒 
绝 妃 ,我们 可 以 得 出 确实 有 我 们 预期 的 模式 ，P- 值 由 下 式 给 出 : 

P(T > 12) = 0.0002 
所 以 ， 我 们 可 以 以 任何 合理 的 水 平 拒绝 H. m 
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口 理论 Cox 和 Stuart 趋势 性 检验 显然 是 符号 检验 的 变形 ， 所 以 当 有 H, 成 立时 ， 检 验 
统计 量 的 分 布 明 显 是 二 项 分 布 ， 而 且 用 前 面 的 第 一 部 分 A,B,C 假设 检验 时 ， 这 个 检 
验 是 无 偏 和 相合 的 ， 但 用 后 一 部 分 时 ， 则 未 必 是 ， 当 用 于 正 态 随机 变量 时 ，Stuart 
(1956) 证明 这 个 检验 关于 最 好 参数 检验 (基于 回归 系数 的 检验 ) BJA. R. E. 是 0.78， 
在 同样 的 情况 下 ， 对 于 Spearman 或 Kendall 的 秩 相 关 性 检验 (将 在 第 5 章 介 绍 的 随机 
性 检验 ) BJA R. E. 是 0.79. 

如 果 检 验 变 为 除去 中 间 1⁄3 的 观测 ， 将 观测 前 面 的 1/3 和 后 1⁄3 配对 ， 则 在 理想 
条 件 下 ， 它 关于 参数 检验 的 ARE 会 增 到 0.83， 显然 与 获得 的 较 大 偏差 相 比 ， 
数据 的 损失 是 小 的 ， 这 表明 另 一 种 变化 ， 即 从 数列 的 两 端 进行 配对 ， 用 所 有 的 数据 
组 成 (X, ,X,),(X,,X,_ |) 等 ， 这 可 能 保留 了 大 的 偏差 ， 而 数据 没有 丢失 . 同上 面 过 程 
一 样 可 以 进行 检验 ， 因 为 在 零 假 设 下 ， 检 验 统计 量 的 分 布 没 有 发 生变 化 . 

对 于 在 例 3. 5. 4 中 给 出 的 相关 性 检验 ， 我 们 没有 研究 它 具 有 什么 性 质 ， 应 用 相关 
性 检验 的 一 个 困难 是 如 果 很 多 观测 值 相等 ， 因 此 ， 就 有 不 止 一 种 用 于 趋势 性 检验 的 
观测 排列 方法 ， 所 以 ,推荐 用 有 最 少 结 点 的 对 数 来 排列 原始 数据 ， 因 为 排列 可 能 还 
有 结 点 ,保守 的 方法 是 选择 最 不 可 能 拒绝 H, 的 排列 . O 

Chatterjee(1966 ) 讨 论 了 位 置 参数 的 两 维 的 符号 检验 .符号 检验 的 另外 一 个 变形 
就 是 用 于 散布 的 趋势 性 检验 (Ury ,1966) ， 或 比较 带 有 一 个 控制 的 几 个 处 理 (Rhyne 
和 Steel,1965). Rao(1968) 把 Cox 和 Stuart 检验 用 于 散布 的 趋势 性 检验 . Mansfield 
(1962 ) 进一步 讨论 了 趋势 性 检验 的 功效 ，Olshen(1967 ) 提出 了 二 次 趋势 对 线性 趋势 
HIRIS. Woodbury ,Manton , Woodbury ( 1977 ) 和 Altham( 1971 ) 给 出 了 符号 检验 的 其 他 
形式 .Schaafsma( 1973) 的 论文 检验 了 符号 检验 次 序 依赖 的 结果 ， 即 ， 一 个 顾客 谨 欢 
哪 一 种 品牌 可 能 受 他 (或 她 ) 第 一 次 所 接触 品牌 的 影响 . 


习题 


l. 随机 抽取 135 名 美国 公民 ， 问 他 们 对 美国 外 交 政 策 的 看 法 ，43 人 反对 美国 的 外 交 政 策 ， 在 
之 后 的 几 周 内 他 们 收 到 了 一 份 时 事 信息 报 ， 然 后 再 问 他 们 的 观点 ; 有 37 人 有 反对, 而 37 人 
中 的 30 人 是 之 前 不 反对 美国 外 交 政策 的 人 ， 问 反对 美国 外 交 政 策 的 人 数 有 显著 变化 吗 ? 

2. 在 习题 1 中 ， 假 设 试验 之 后 反对 美国 外 交 政 策 的 37 个 人 是 之 前 也 反对 的 人 问 反 对 美国 
外 交 政 策 的 人 数 有 显著 变化 吗 ? 

3. 在 某 个 城市 ， 最 近 15 年 内 每 100,000 个 人 中 交通 事故 的 死亡 率 分 别 是 : 17.3,17.9,18. 4， 
18.1,18.3,19.6,18.6,19.2,17.7,20.0,19.0,18.8,19.3,20.2,19.9. 认为 死亡 率 在 增加 是 
否 有 根据 ? 

4. 中 西部 某所 小 型 的 大 学 在 最 近 34 年 记录 了 每 年 大 一 男生 的 身高 ， 平 均 数 为 68. 3,68. 6， 
68. 4,68. 1 ,68. 4,68. 2,68. 7,68.9,69.0,68.8,69.0,68.6,69.2,69.2,68.9,68.6,68.6,68.8, 
69. 2 ,68. 8 ,68. 7 ,69. 5 ,68. 7 ,68. 8 ,69. 4,69. 3 ,69. 3,69. 5 ,69. 5 ,69. 0,69. 2,69.2,69. 1 ,69. 9. 
问 这些 数 据 有 上 升 趋势 吗 ? 

5. 某 制 造 商 计算 了 44 个 月 生产 某 种 产品 所 需 费 用 的 平均 值 〈 以 美元 为 单位 ) : 13. 65 ,13.41， 
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13. 53 , 13. 23, 13.58, 13. 43 , 13.73, 13.40, 13.70, 13.58, 13.80, 13.40, 13.63, 13.69, 13. 92, 
13.68,13.72, 13.42, 13.66, 13.98, 13.81, 13.60, 13.32, 13.45, 13.27, 13.26, 13.28, 13.29, 
13.10,13.09, 13. 36, 13.40, 13.35, 13.53, 13.66, 13. 10, 13.28, 13.33, 13.02, 13.09, 13. 12, 
13. 16 ,12. 96,12. 95， 问 这 些 平均 数 是 否 有 统计 意义 下 的 趋势 ? 

6. 在 一 个 研究 他 人 意见 对 人 有 无 影响 的 试验 中 ， 把 不 同 长 度 的 20 根 线 每 次 一 根 分 别 放 在 被 测 
者 A 和 B 面前 ,要求 他 们 大 声 地 估计 出 每 根 线 的 长 度 . 在 被 测 者 B 不 知道 的 情况 下 ， 指 导 
被 测 者 A 先 说 出 她 的 估计 ， 让 她 高 估 前 10 根 ， 低 估 后 10 R, ÆT A 的 估计 后 ，B 再 说 
出 他 的 估计 值 . 估计 的 错误 是 估计 值 减 去 真实 值 的 差 ， 记 录 如 下 


线 
1 2 3 4 5 6 7 8 9 10 
A 的 错误 +0.3 +11 +09 +06 +1.0 +13 +08 +16 +12 +08 
B 的 错误 -01 +06 +10 +07 +02 +09 -0.1 +02 00 +05 
线 


11 12 13 14 15 16 i7 18 19 20 
A 的 错误 —13 -11 -13 -0.7 -1.4 -11 -08 -05 -12 -1.0 
B 的 错误 -06 -1.2 -10 -0.7 -10 -01 -05 00 -04 -0.3 
问 被 测 者 A 和 B 的 错误 之 间 是 否 有 明显 的 正 相 关 ? 
7 下 面 是 一 名 职业 棒球 队 主 力 队员 12 年 中 本 难 打 次 数 和 平均 击 球 数 的 记录 . 
1988 1989 1990 1991 1992 1993 


KEFA 7 14 17 15 9 19 
平均 击 球 数 0212 0.232 0.234 0.210 0.201 0.256 

1994 1995 1996 1997 1998 1999 
KEHRA 16 17 22 17 13 10 
平均 击 球 数 0.261 0.247 0.255 0.241 0.238 0.235 


问 他 每 年 本 侄 打 的 次 数 与 平均 击 球 次 数 是 否 有 明显 的 相关 性 ? 
8. 检验 下 面 的 数据 看 一 个 家 庭 的 年 收入 和 该 家 庭 中 孩子 的 个 数 是 否 有 显著 的 相关 性 . 


收入 TASR KA TASR KA BPMK 


(美元 ) 
17,440 3 23,320 3 28,940 3 
17,664 2 23,569 4 29,300 1 
17,721 4 23,950 2 29,371 3 
17,883 3 24,023 3 29,512 1 
18,000 4 24,330 5 29,662 1 
18,332 2 24,545 2 29,804 2 
18,653 0 24,922 5 30,167 2 
18,781 3 25,571 4 30,634 3 
19,087 6 25,624 4 31,235 1 
19,686 5 25,873 2 31,797 3 
19,832 2 26,010 1 31,880 4 
20,100 1 26,145 3 32,363 1 
20,222 6 26,513 2 32,946 3 
20,435 3 26,660 4 33,586 2 
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收入 孩子 个 数 KA ”孩子 个 数 KA 孩子 个 数 


(美元 ) 

20,961 5 26,984 5 34,000 2 
21,382 2 27,463 0 34,443 3 
21,957 0 27,702 1 35,693 1 
22,190 8 27,914 4 39,247 1 
22,212 1 28,244 2 40,540 1 
22,635 4 28,698 4 55,686 2 


9. 对 相距 50 英里 的 两 个 飞机 场 进行 一 年 的 观测 ， 来 断定 天 气 条 件 对 可 用 性 是 否 有 显著 差异 . 
有 286 天 两 个 机 场 都 全 天 开放 ， 有 62 天 由 于 严峻 的 天 气 两 个 机 场 至 少 都 关闭 一 段 时 间 ， 有 
14 天 机 场 A 关闭 但 B 开放 ，3 天 相反 . 问 由 于 天 气 条 件 的 可 用 性 是 有 显著 的 差异 吗 ? 


思考 题 


1，” 某 理发 店 正 考虑 将 理发 的 价格 提高 1 美元 ， 同 时 给 顾客 一 张 可 以 在 附近 一 家 酒吧 喝 饮 料 的 
免费 优惠 券 ， 进行 一 项 调查 ， 在 实际 顾客 和 潜在 顾客 〈 非 顾客 ) 中 随机 选择 200 个 作为 样 
本 ， 告 诉 他 们 这 项 提议 .样本 中 10% 的 顾客 表示 他 们 会 到 别 的 理发 店 去 理发 ， 样 本 中 非 顾 
客 的 5% 表示 他 们 会 到 这 里 来 理发 .检验 零 假 设 : 如 果 样 本 中 只 有 20 个 是 目前 的 顾客 ， 提 
出 的 建议 不 会 增加 来 这 个 理发 店 理发 的 人 数 . 如 果 目 前 的 顾客 是 66， 结果 会 有 怎样 
的 变化 ? 

2. ”McNemar 检验 的 数据 可 以 写成 二 维 观 测 X,Y,， 其 中 每 个 观测 为 0 或 1“ 之 前 ”, 0 或 1 
“之 后 "， 称 为 “成 对 上 检验 ”的 参数 检验 常常 用 于 这 种 类 型 的 数据 ， 成 对 : 检验 使 用 差 
D, =X, 一 ,i=1,2,…,n'， 在 检验 统计 量 中 使 用 样本 均值 D 和 样本 标准 差 5: 

t=DVn’—1/5 
将 1 值 与 自由 度 为 n' -1 的 1 分 布 的 分 位 数 (在 表 A21 中 可 获得 ) 相 比 较 ， 如 果 D, 不 是 正 
态 分 布 ， 则 这 个 检验 只 是 一 个 近似 . 
证 明 上 和 也 的 如 下 关系 成 立 : 
(n’ — 1)T; n't? 
pa n' — T, 或 MRTE 

其 中 , T, H (1) RAH. BD34 T, 变 大 时 , 7 也 变 大 ， 所 以 ， 如 果 它 们 的 临界 域 相互 对 应 
(H T, RAR r 较 大 时 ， 拒绝 有 )， 则 这 两 个 检验 是 等 价 的 . 
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列 联 表 (contingency table) 是 一 列 按照 矩阵 形式 排列 的 自然 数 ， 这 些 自然 数 通常 
代表 的 是 数量 或 者 频数 ， 例 如 : 昆虫 学 家 可 以 说 他 正在 观察 37 只 昆虫 ， 也 可 以 用 1x3 
列 联 表 描 述 他 所 观察 到 的 : 


Tli} 


月 HERE 其 他 总 和 
mw | || m 
因为 只 有 一 行 ， 所 以 这 个 列 联 表 是 一 维 的 . 
这 个 昆虫 学 家 可 能 希望 更 具体 一 些 ， 于 是 他 用 了 一 个 2 x3 列 联 表 来 描述 : 


总 和 12 22 3 37 
这 里 的 总 和 包括 两 个 行 总 和 (row total) ， 三 个 列 总 和 “(column total) 与 一 个 所 有 
行列 总 和 ， 它 们 是 可 选择 列 在 表 上 的 ， 通常 只 是 为 了 读者 的 方便 ， 这 个 列 联 表 是 二 维 
的 ， 并 且 可 以 扩展 到 含有 r 行 和 c 列 的 r xc 列 联 表 ， 三 维 及 三 维 以 上 的 列 联 表 也 有 可 
能 出 现 ， 但 本 章 只 对 它们 做 简要 的 讨论 . 


4.1 2x2 列 联 表 


一 般 r x c 列 联 表 是 一 排 排 成 > 行列 的 自然 数 ， 因 此 有 rc 个 数 格 或 者 位 置 来 放置 
这 些 数 ， 本 节 主 要 讨论 r=2 和 c=2 的 情形 ， 即 2 x2 列 联 表 ， 因 为 包含 四 个 数 格 ， 所 
以 2 x2 列 联 表 也 被 称 为 四 重 (fourfold) 列 联 表 . 

从 某 个 总 体 中 随机 选取 的 N 个 对 象 ， 在 处 理 或 者 一 个 事件 发 生前 将 它们 归 人 两 类 
中 的 某 一 类 ， 这 时 可 以 用 2 x2 列 联 表 ， 在 处 理 后 再 次 检查 这 NN 个 对 象 并 且 分 成 两 类 . 
需要 解决 的 问题 是 : 这 种 处 理 是 否 明显 改变 了 每 类 中 所 含 对 象 的 比例 ? 列 联 表 的 使 用 将 
在 3.5 节 中 介绍 ， 可 以 看 到 ， 合适 的 统计 方法 是 符号 检验 的 变形 ， 即 McNemar 检验 . 
因为 相同 的 样本 用 在 两 种 情形 中 (比如 在 “处 理 前 ”和 “处 理 后 ”) ， 所 以 McNemar 检 
验 能 够 发 现 微小 的 差异 .同一 假设 检验 对 应 于 McNemar 检验 的 另 一 检验 方法 就 是 从 处 
理 前 后 的 总 体 中 各 抽取 一 随机 样本 ， 然 后 做 比较 .但 是 这 种 使 用 两 个 不 同 的 随机 样本 
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又 带 来 了 另外 不 理想 的 变异 ， 因 为 这 种 变异 使 得 在 总 体 中 由 处 理 所 引 起 的 变化 不 明显 . 
然而 ， 在 不 实用 或 甚至 是 可 能 使 用 同样 的 样本 两 次 时 ,那么 可 使 用 本 节 将 要 描述 的 
方法 . 

对 于 零 假设 : 某 事 件 4( 某 些 特定 事件 ) 在 两 个 总 体 中 发 生 的 概率 相同 〈 零 假 
设 也 可 以 表述 为 : 具有 特征 A 的 总 体 比 例 对 两 个 总 体 是 相同 的 )， 第 一 步 需要 从 两 个 
总 体 中 各 抽取 一 个 随机 变量 来 检验 原 假设 . 


PP2 x2 概率 差异 的 Xx 检验 


数据 ”从 一 个 总 体 (或 处 理 前 ) 中 抽取 一 个 具有 个 观测 的 随机 样本 ， 并 且 每 个 观 
测 被 归 入 类 1 或 类 2， 两 类 的 观测 数 分 别 是 0,, 和 On, 3EH O, + 0, =n. 从 另 一 个 
总 体 (或 者 处 理 后 的 第 一 个 总 体 ) 中 抽取 n, 个 观测 并 且 记 类 1 与 类 2 中 的 样本 数 分 别 
为 0, ,0 ， 这 里 O, +O, =n,， 数 据 可 以 被 放 在 下 面 的 2x2 列 联 表 中 ， 观 测 总 数 记 
为 N. 


类 1 类 2 总 和 
总 和 C, G N = n. + n, 
假定 条 件 
1. 每 个 样本 是 随机 样本 . 


2. 两 个 样本 相互 独立 . 
3. 每 一 个 观测 可 以 被 归 人 类 1 和 类 2 中 的 任 一 个 . 
检验 统计 量 ”如 果 任 意 列 总 和 是 0， 那 么 检验 统计 量 T =0， 否 则 ， 
VN(OnOn - O10) 
Vnin:CC2 
零 分 布 因为 所 有 的 O, ,0,,0, 和 0;, 可 能 值 有 不 同 的 结合 ， 所 以 7, 的 精确 分 布 难 
以 用 表 的 形式 表示 出 来 ， 因 此 我 们 用 大 样本 逼近 或 标准 正 态 分 布 逼近 ， 其 分 位 数 在 
表 Al 中 给 出 . 
假设 “从 总 体 1 中 随机 抽取 的 观测 归 人 类 ! 的 概率 记 为 p,， 从 总 体 2 中 随机 抽取 的 观测 归 入 
类 1 的 概率 记 为 p,， 这 里 p, Ap, 不 必 已 知 ， 且 假设 仅仅 是 给 定 它们 之 间 的 关系 . 
A，( 双边 检验 ) 


Ti = (1) 


Ho: pi = p2 
Hi: pi # p 
a 为 近似 水 平 ， 如 果 T, 比 标准 正 态 随机 变量 Z 的 a/2 Hu Sk saka T, 比 2Z 的 1 - a/2 
分 位 数 大 ， 则 拒绝 H,, Z 的 分 位 数 在 表 Al 中 可 查 到 . 
从 表 Al 中 看 出 ，p- 值 是 Z 小 于 7 的 观测 值 或 大 于 也 的 观测 值 的 概率 中 较 小 者 
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的 2 倍 . 
HE, HERBER, T? 常 代替 T, 作为 统计 量 ， 那 么 拒绝 域 就 是 自由 度 为 1 的 卡 
方 分 布 的 右边 ， 在 表 A2 中 可 查 到 . 
B. (左边 检验 ) 
Ho: pı > p2 
Hı: pı < p2 
a MEKE, WRT, 比 标准 正 态 随 机 变量 Z 的 a 分 位 数 小 ， 则 拒绝 H,, Z 的 分 位 
数 在 表 Al 中 可 查 到 . 
从 表 Al 中 看 出 ，P- 值 是 Z 小 于 也 观测 值 的 概率 . 
C. (右边 检验 ) 
Ho: pi <p2 
Hi: pi > p2 
a 为 近似 水 平 ， 如 果 T, 比 标准 正 态 随机 变量 Z 的 1 -a 分 位 数 大 ， 则 拒绝 H,，Z 的 分 
位 数 在 表 Al 中 可 查 到 . 
从 表 Al 中 看 出 ，P- 值 是 Z 大 于 T, 观测 值 的 概率 . 
计算 机 辅助 Minitab ,S-Plus ,SAS 和 StatXact 可 完成 这 个 检验 ， 并 且 正 如 思考 题 3. 1.2 
中 介绍 的 那样 ， 还 能 求 出 两 个 概率 差异 的 置信 区 间 . —— 
例 4.1.1 
从 两 辆 货车 上 装 的 产品 中 随机 抽样 ， 来 检查 两 车 货物 的 次 品 率 是 否 有 差异 ， 第 一 辆 
货车 的 86 件 产品 中 有 13 件 次 品 ， 第 二 辆 的 74 件 产品 中 有 17 件 次 品 . 
次 品 非 次 品 总 和 


w [u [ | < 
总 和 30 130 160 
它 满足 我 们 前 面 的 假设 条 件 ， 所 以 用 双边 检验 来 检验 H,: 两 个 货车 上 的 次 品 比 例 相 
等 用 如 下 检验 统计 量 : 
VN (OnOn - O10O2) 
VmnCiC 


_ V160((13)(57) — (73)(17)) _ _1 2695 
V (86)(74)(30)(130) 


从 表 Al 中 查 到 标准 正 态 分 布 的 0.975 分 位 数 是 1.9600， 因 此 近似 大 小 0.05 的 拒绝 
WES T, 大 于 1. 9600 或 小 于 - 1. 9600 的 所 有 值 ， 观 测 值 是 -1.2695， 所 以 在 显著 


PEKE a =0. 05 下 可 以 接受 零 假设 . 
p- 值 是 Z 小 于 7 的 观测 值 - 1. 2695 的 概率 较 小 者 的 2 倍 ， 在 表 Al 中 可 以 查 


到 ,是 0.102， 所 以 近似 p- 值 是 0.204， 因 此 接受 H, 还 是 相当 安全 的 . xs 


rt pas S: yer 
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以 下 给 出 使 用 单 边 检 验 的 例子 . 
例 4. 1.2 
美国 海军 学 院 给 学 生 的 住所 安装 了 一 种 新 的 照明 系统 ， 要 说 明 新 的 照明 系统 会 导致 
视力 下 降 ， 因 为 使 学 生 的 眼睛 处 于 连续 的 疲劳 中 ， 考 虑 研究 检验 零 假设 : 
Bo: 毕 业 学 生 在 新 照明 系统 下 有 20-20 (好 ) 视力 的 概率 大 于 等 于 在 旧 照 明 系 统 下 好 
视力 的 概率 . 
Hi: 新 系统 下 好 视力 的 概率 小 于 旧 系 统 下 好 视力 的 概率 . 
令 p 为 随机 选取 的 毕业 学 生 在 旧 的 照明 系统 下 有 好 视力 的 学 生 概率 ，p, 为 是 新 系 
统 下 相应 的 概率 ， 则 前 面 的 假设 可 以 表述 为 : 
Ho: pi < po 
Hi:pi >p 
这 与 假设 集 C 匹 配 ， 新 系统 建立 前 的 所 有 毕业 班 作为 总 体 1，4 年 使 用 新 灯光 系统 
的 第 一 个 毕业 班 作为 总 体 2， 从 这 两 个 总 体 中 随机 取样 . 希望 这 些 样 本 同 先前 全 体 
毕业 班 总 体 中 得 到 随机 样本 中 真实 的 和 潜在 的 表现 一 样 . 


假定 有 如 下 结果 : 
好 视力 差 视力 
旧 系 统 On = 714 ot | m = 825 
新 系统 O = 662 | 0n=154 | m = 816 
总 和 1376 265 N = 164] 


判决 法 则 C 定义 了 a =0.05 的 临界 域 是 T, 大 于 1.6449 (从 表 Al 中 获得 ) 的 
所 有 值 . 计算 T, 得 到 : 
T, = VN (OnOn - O02) 

V nyn,C IC; 
_ V1641[(714)(154) — (111)(662)] _ > og2 
V(825)(816)(1376)(265) 
所 以 ， 显 然 拒 绝 零 假 设 ， 从 表 Al 中 我 们 看 到 ， 在 显著 性 水 平 大 约 为 0.002 时 也 应 
该 拒绝 零 假设 ， 所 以 p- 值 是 0. 002. 
因此 我 们 可 以 得 出 ， 代 表 两 个 毕业 班 总 体 差 视力 的 比例 的 确 不 同 ， 并且 可 以 预 

见 发 展 趋势 ， 即 : 总 体 2 (新 的 光照 系统 下 ) 的 视力 比 总 体 1 (在 旧 系 统 下 ) HU. 
视力 更 差 是 否 是 新 的 光照 系统 导致 的 还 不 能 说 明 . 然而 ,在 这 个 假设 检验 的 例子 中 
可 以 说 明 ， 视 力 变 差 的 原因 同 新 的 光照 系统 有 关 . E 
口 理论 ”这 里 所 给 出 的 2 x2 列 联 表 是 下 一 节 所 给 出 的 ~xe 列 联 表 的 一 种 特殊 情况 ， 
所 以 相关 的 理论 也 是 后 面 的 rxc 情形 的 特殊 情况 . 然而 ,除了 r 和 很 小 的 情况 外 ， 
检验 统计 量 的 精确 分 布 难以 求 出 ， 因 此 这 里 我 们 要 给 出 T, 的 精确 分 布 . 
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当 :pi =p; =P 为 真 时 ,TT 的 精确 概率 分 布 可 以 如 下 计算 ,对 于 总 体 1 中 的 样 
Æ, 2Š 1 中 项 的 概率 和 类 2 rh n, -x 项 的 概率 通过 二 项 分 布 给 出 
类 1 类 2 


o(s [ s Tm) (mam o 


类 似 地 ， 对 于 总 体 2 中 抽取 的 样本 ， 类 1 H x, 项 的 概率 和 类 2 中 心 - x, 项 的 概率 
如 下 : 
类 1 类 2 


| 总 体 2 ) a 网 ps = pis a (3) 


因为 两 个 样本 是 独立 的 ， 所 以 联合 事件 的 概率 可 以 通过 (2) 和 (3) 式 的 右边 相 乘 
得 到 ， 即 : 


类 1 类 2 
总 体 1 K! =[A)[H2| pnta — pN 

| ef | Tags | (rem o 
在 简单 的 情形 下 ,我们 取 n, =2 Mn =2， 样 本 空间 中 有 9 个 不 同 的 点 ， 对 应 有 如 下 
9 个 可 能 的 表 : 


如 果 五 为 真 的 概率 
表 (p=1/2) (p=1) T, 
EoLA 4 1/16 1 
不 确定 
afo ” 
2p3(1 — p) 1/8 0 1.1547 
p (1 — p? 1/16 0 2.0000 
2p'(1 = p) 1/8 0 —1.1547 
4p2(1 — p) 1⁄4 0 0 
un 2p(1 一 p) 1/8 0 1.1547 
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E pa — p) 1/16 0 —2.0000 
HE. 2p(1 — p} 1/8 0 —1.1547 
un tk 1/16 0 不 确定 


因为 0/0 未 定义 ， 所 以 T, 的 值 不 确定 . 但 正如 第 5 个 结果 能 很 强 地 指出 H, 为 真一 
样 ， 导 致 T, 值 不 确定 的 两 个 结果 也 能 很 强 地 指出 T, 为 真 ， 所 以 同 第 5 个 结果 保持 
一 致 ， 我 们 可 以 定义 第 一 个 和 最 后 一 个 结果 中 的 7 为 0， WAT 有 如 下 概率 
分 布 : 
p = 1/2 p=1 
P(T, = -2) = 1/16 P(T, =0)=1 
P(T, = —1.1547) = 1/4 
P(T, = 0) = 3/8 
P(T, = 1.1547) = 1/4 
P(T, = 2) = 1/16 
类 似 地 ， 任 意 大 小 为 n, An, 的 样本 的 精确 分 布 ， 可 以 通过 适当 地 定义 也 的 不 确定 
值 来 求 出 ， 然而， 正如 前 面 的 例子 所 示 ， 即 使 当 H, 为 真 时 ， 概 率 分 布 函 数 也 不 是 唯 
一 的 ， 而 是 依赖 于 p， 因 此 在 前 面 检验 中 零 假设 是 一 个 复合 假设 . 但 不 容易 看 出 来 的 
是 ， 当 p=1/2 时 ， 前面 小 样本 情形 的 临界 域 水 平 最 大 .因此 通过 令 p =1/2 可 以 求 出 
Qa， 如果 临界 域 对 应 于 最 大 的 T, (i.e. ,Ti =2)， 则 a =0. 0625. 
为 了 说 明正 态 分 布 作 为 大 样本 的 盈 近 分 布 是 合理 的 ， 考 虑 O11/n, - O, /n, 的 均 
值 和 方差 分 别 是 p. -P p.Q./n, +p,9,/n,， 而 在 假设 H,: p =p, 下 ,均值 是 0, X 
差 用 估计 量 代 震 ， 其中， 用 C/N 估计 p，Cs/N 估计 4=1-P， 由 中 心 极 限定 理 O, 
和 O,, 是 渐 近 正 态 的 ， 所 以 O,,/n, - 0,/n, 也 是 渐 近 正 态 的 . 在 HH, 下 减 去 均值 (0)， 
除 以 估计 的 标准 差 ， 我 们 得 到 ; 
OHVnl — Ox/n; 
当 H, 为 真 时 ， 上 式 渐 近 为 一 标准 正 态 随机 变量 .然而 (5) 式 的 表达 式 经 过 简单 的 
代数 运算 ， 它 就 是 检验 统计 量 Ti ， 所 以 说 明了 T, 的 零 分 布 是 渐 近 于 标准 正 态 . D) 
当 容量 为 N 的 单个 样本 的 每 个 观测 根据 两 种 属性 分 类 ， 每 种 属性 可 取 两 种 形式 
之 一 时 ， 也 可 以 使 用 2 x2 列 联 表 . 那么 就 有 (2) (2) = 4 种 两 种 属性 的 不 同 组 合 ， 
并 且 2 x2 列 联 表 是 将 每 一 类 中 的 观测 数列 成 表 的 最 方便 的 方式 其实，2 x2 列 联 表 


(5) 
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的 这 种 用 法 是 r xc 列 联 表 的 特殊 情形 ， 且 分 开 表述 也 没有 任何 特殊 的 变化 (比如 本 


节 的 单 边 检 验 )， 因 此 我 们 在 下 一 节 中 来 阐述 它 . 

列 联 表 的 这 种 类 型 同 第 一 种 类 型 的 主要 区 别 是 这 种 列 联 表 的 行 总 和 是 随机 变量 ， 
它 的 值 只 有 在 数据 获得 后 才 可 确定 . 而 第 一 种 列 联 表 行 总 和 表示 了 两 种 样本 的 样本 
容量 ， 在 数据 获得 前 它 的 值 就 已 知 ， 所 以 是 非 随 机 的 . 两 种 表 的 列 总 和 都 是 随机 
变量 . 

列 联 表 的 第 三 种 类 型 是 行 总 和 与 列 总 和 都 是 非 随 机 的 ， 也 就 是 说 ， 行 总 和 与 
列 总 和 在 数据 获得 前 就 已 知 ， 这 种 情况 ， 不 如 列 联 表 的 前 两 种 类 型 常见 ， 但 是 不 
论 是 哪 一 种 类 型 ， 经 常会 用 到 以 下 的 统计 方法 ， 因 为 它 很 容易 确定 精确 的 己 - 值 . 
这 个 方法 在 20 世纪 30 年 代 中 期 几乎 同时 由 R. A. Fisher( 1935), IL O. Irwin( 1935) 
和 F. Yates( 1934) 发 展 起 来 的 ， 而 众所周知 的 是 Fisher 的 精确 检验 . 


> Fisher 精确 检验 


数据 ”如 同 前 面 的 检验 ， 除 了 行 总 和 rr 和 NN-r,， 列 总 和 c 和 Nc 事先 确定 (从 而 不 
随机 ) 外 ， 把 数据 中 的 N 个 观测 放 在 2 x2 列 联 表 中 . 
列 1 列 2 


假定 条 件 

1. 每 个 观测 只 归 和 人 到 一 个 单元 中 . 

2. 行列 总 和 确定 且 不 随机 (但 注意 结尾 关于 行 、 列 和 行列 随机 总 和 的 注释 ). 
检验 统计 量 ”检验 统计 量 T, 是 第 一 行 第 一 列 单元 格 中 的 观测 数 . 
零 分 布 ” 当 H, AAH, T, 的 精确 分 布 由 超 几 何 分 布 给 出 ( 见 (1.3.17) A), 对 


x=0,1,.…,min(r,c) 


=0 ”对 其 他 xX. i (6) 


ia +. (7) 


lre(N — r)(N - c) 
N(N —- 1) 


得 到 一 个 大 样本 逼近 ,其 渐 近 分 布 服从 在 表 Al 中 给 出 的 标准 正 态 分 布 . 如 果 行 总 
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和 或 列 总 和 ， 或 两 者 同时 是 随机 的 ， 在 大 样本 渐 近 中 用 由 (1) = H WJ T, 更 
精确 | 
假设 Sp 为 第 一 行 中 的 一 个 观测 归 入 第 一 列 的 概率 ，p, 为 第 二 行 中 的 一 个 观测 归 
人 第 一 列 的 概率 ，tw, 为 T, 的 观测 值 . 
A. (双边 检验 ) 
Ho: pı = p2 
Hı: pı # p2 
首先 用 (6) 式 来 求 p- 值 ，p- 值 是 PP (T, Sta), P (T>t,,) 中 较 小 者 的 2 f. 
在 显著 性 水 平 a 下 ， 如 果 p- 值 <a， 则 拒绝 H,. 
B. (左边 检验 ) 
Ho:pi Z p> 
Hi:pi <p; 
用 (6) RRHH p- P (T, Sta). 在 显著 性 水 平 a 下 ， 如 果 疡 值 和 w， 则 拒绝 H,. 
C. (右边 检验 ) 
Ho: pi < p2 
Hi:pi > p2 
用 (6) RRE p-fË P (T,>ta). ERBERK a 下 ， 如 果 p- 值 <a， 则 拒绝 H. 
计算 机 辅助 ”Fisher 精确 检验 可 以 在 S-Plus, SAS, StatXact 中 找到 . ——OQAs“< 
评注 
这 个 检验 对 于 具有 随机 行 总 和 ， 随 机 列 总 和 ， 或 行列 总 和 同时 都 是 随机 的 列 联 
表 是 有 效 的 ， 也 就 是 说 ， 这 个 精确 检验 为 样本 空间 中 给 定 行 总 和 与 列 总 和 的 一 个 子 
集 求 出 了 p- 值 ， 每 个 不 同 的 行列 总 和 和 集 又 表示 另外 的 互 不 相 容 的 子 集 ， 因 此 将 整个 
样本 空间 分 成 了 几 个 互 不 相 容 的 子 集 ， 如 果 每 个 子 集 的 临界 域 在 假设 了 下， 有 一 个 
条 件 概率 小 于 等 于 a， 那 么 所 有 临界 域 的 并 在 H, 下 有 一 个 无 条 件 概率 小 于 等 于 a, 
并 且 检 验 是 有 效 的 ， 然 而 ， 这 种 精确 检验 的 功效 通常 小 于 一 种 更 适当 的 近似 行 总 和 ， 
或 列 总 和 ， 或 行列 总 和 为 随机 的 检验 功效 . 
评注 (连续 性 修正 ) 
T, 的 大 样本 允 近 可 以 通过 连续 性 修正 来 改进 ， 即 对 于 左边 概率 ， 在 从 表 Al 中 
查 p- 值 之 前 ， 给 T, 的 分 子 加 上 0. 5， 对 于 右边 概率 ， 则 从 分 子 上 减 去 0. 5. 这 样 得 到 
的 概率 在 多 数 情况 下 会 更 精确 . 
例 4. 1. 3 
银行 新 雇用 了 10 男 4 女 共 14 个 员工 ， 能 力 等 同 ， 银 行 主管 正在 给 他 们 分 配 新 工作 ， 
有 10 个 岗位 是 出 纳 员 ，4 个 是 账户 代表 ， 零 假设 是 男女 有 等 同 的 机 会 得 到 想 要 的 账 
户 代表 的 工作 ， 单 边 备 择 假设 是 女性 比 男性 更 有 可 能 得 到 账户 代表 的 工作 : 
只 有 一 位 女性 被 分 配 为 出 纳 员 ， 那 么 零 假设 可 以 拒绝 吗 ? 因为 行列 总 和 已 确 
定 ， 是 非 随机 的 ， 所 以 可 以 填 人 下 面 的 2 x2 列 联 表 . 
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账户 代表 出 纳 员 


Ho: pi >p 

Hi:pi < p2 

H (6) 式 给 出 的 精确 的 左边 p- 值 是 : 
P(T,<1) = P(T: = 0) + P(T; = 1) 


GURS 
C) D 四 


= i001 + 1001 0041 


当 a =0. 05 时 ， 拒绝 零 假设 . = 

评注 
将 例 4. 1.3 中 的 精确 p- 值 与 列 总 和 是 随机 情况 下 的 精确 p- 值 作 一 下 比较 ， 即 假 

定 一 个 问题 中 它 的 列 总 和 是 随机 的 、 并 且 结 果 与 上 面 所 给 出 的 列 联 表 相同 ， 试 验 者 
想 通 过 (4) 式 得 到 精确 的 p- 值 . 将 p=0.03 代 人 (4) A ( 见 思考 题 3) ， 可 以 得 到 
T, 的 左边 概率 的 最 大 值 ， 其 精确 p- 值 是 0.012， 它 比 之 前 用 Fisher 精确 检验 得 到 的 
0.041 小 的 多 .从 该 例 中 列 联 表 得 到 T, = -2.4321， 查 表 Al 得 到 也 的 正 态 渐 近 为 
0. 008 ， 这 接近 于 p- 值 的 真 值 ， 这 说 明 Fisher 精确 检验 是 精确 的 仅 当 行列 总 和 是 非 随 
机 的 .在 其 他 情形 下 Fisher 精确 检验 仍 有 效 ， 但 有 引起 极 大 争议 的 趋势 . 
口 理论 ”为 了 说 明 T, 服从 超 几 何 分 布 ， 让 我 们 从 一 个 具有 固定 行 总 和 的 列 联 表 开 始 ， 
其 概率 由 (4) 式 给 出 如 下 〈 变 换 记号 ) : 


(:) [` W: J pa 一 PN- (8) 

取 值 为 c，N- c 的 列 总 和 服从 二 项 分 布 ， 其 概率 如 下 
(ra -pr (9) 
同 例 1.3.8 一样 ， 在 给 定 列 总 和 的 条 件 下 ， 得 到 表 上 结果 的 条 件 概率 ， 可 用 (8) R 
除 以 (9) 式 得 到 (6) 式 得 到 .通过 在 T, 上 减 去 均值 除 以 超 几何 分 布 的 标准 差 得 到 
T,， 并 用 中 心 极限 定理 得 到 大 样本 正 态 允 近 . D 
有 时 需要 将 几 个 2 x2 列 联 表 合成 一 个 做 整体 分 析 .， 当 一 个 整体 试验 包括 几 个 
在 不 同 环境 中 操作 的 小 试验 时 ， 在 零 假设 下 的 共同 的 概率 随 着 环境 的 不 同 而 不 同 ， 
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并 且 每 一 个 小 试验 都 有 自己 的 2 x2 列 联 表 ， 这 时 常常 需要 进行 这 种 处 理 . 因为 得 
到 每 个 列 联 表 的 环境 不 同 ， 所 以 这 几 个 表 不 能 合成 单一 的 一 个 2 x2 列 联 表 . 
Mantel 和 Haenszel( 1959) 提出 了 合并 几 个 2 x2 列 联 表 的 一 种 方法 . 


> Mantel-Haenszel 检验 
数据 ”将 数据 综合 以 后 放 入 几 个 2 x2 列 联 表 中 ,每 个 列 联 表 的 行列 总 和 都 是 非 随 


机 的 . 
假设 表 的 数目 Kk 二 2， 并 且 第 i 个 表 具 有 如 下 形式 : 
列 1 列 2 
行 1 r, 
fT 2 N, — r, 
N, 
假定 条 件 “ 每 个 列 联 表 的 假设 条 件 与 Fisher 精确 检验 相同 ， 并 且 几 个 列 联 表 是 由 独立 
的 试验 得 到 的 . 
检验 统计 量 


FiCi 
pin N; 
rici(Ni — ri)(Ni ~ ci) 
Ni(Ni — 1) 
Fom EFBRAH, T, 的 分 布 近似 于 表 Al 中 给 出 的 标准 正 态 分 布 ， 并 且 可 以 通 
过 连续 修正 来 提高 精确 的 概率 . 也 就 是 说 ， 对 于 左边 概率 ， 在 从 表 Al 中 查 p- 值 时 给 
T, 的 分 子 加 上 0.5， 对 于 右边 概率 ， 减 去 0.5， 这 样 得 到 的 概率 在 多 数 情 况 下 会 更 
精确 . 
假设 “在 第 i 个 列 联 表 中 ，, 令 内 是 被 归 人 第 一 行 第 一 列 中 的 观测 的 概率 ， 令 px 是 第 
二 行 第 一 列 相 应 的 概率 . 
A. 〈 双 边 检验 ) 
Ho: pii = Ppi HARARY i= 1:2,- -+k 
Hy: BÈ Pii > pai, HRAS i BR pu < pu kA i RAA AR. . 
在 水 平 a F, MRT, KT aas 或 T DF zoa WEARER. AE z 代表 的 是 表 
Al 给 出 的 标准 正 态 分 布 的 p 分 位 数 . 
一 个 服从 标准 正 态 分 布 的 随机 变量 小 于 观测 T, 或 大 于 观测 T, 的 概率 ， 不 论 哪 一 
个 小 ，p- 值 都 2 倍 于 此 概率 . 
B. (左边 检验 ) 


Ho: Pii > Pai, RA i= 1,2; LE k 
Hi: Ppi: SP HRA Ji BXH i pu< pi 


在 水 平 a 下 如 果 T, 小 于 z。， 则 拒绝 零 假设 ，z。 从 表 Al 中 获得 ，p- 值 是 一 个 服从 标 
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准 正 态 分 布 的 随机 变量 小 于 观测 T, 的 概率 . 
C. (右边 检验 ) 
Ho: pii 志 pzi, 对 所 有 的 i= 12,- -k 
Hi: Pii 之 pzi, 对 所 有 的 i, 且 对 某 个 i,p1; > pi 
EKE a FHIR T, 大 于 z,_,。， 则 拒绝 零 假设 ，z, ,可 从 表 41 中 获得 . P- 值 是 一 个 服 
从 标准 正 态 分 布 的 随机 变量 大 于 观测 T, 的 概率 . 
计算 机 辅助 Mantel-Haenszel 检验 可 以 在 5 - Plus 和 545 中 找到 . 一 一 一 一 一 一 
评注 
像 Fisher 精确 检验 一 样 ， 即 使 行 总 和 或 列 总 和 是 随机 的 ， 这 种 检验 仍 是 有 效 的 . 
但 在 那 种 情况 下 ， 用 如 下 的 检验 统计 量 代 替 T, 更 准确 . 


> x; 一 x 
Juk a= === e 
ric (N; — ri)(Ni — ci) 
N; 
它 可 以 与 正 态 分 布 作 比较 ， 正 如 像 土 面 描述 的 也 一 样 ， 当 用 检验 统计 量 T, 时 ， 不 应 
该 用 连续 修正 来 找 p- 值 . 
例 4. 1.4 


参考 Li，Simon 和 Gart(1979) ， 在 一 个 测试 成 功率 是 否 提高 的 试验 性 治疗 中 ， 把 癌 
症 病人 分 成 3 组 .成 功 与 失败 的 次 数 概 括 如 下 : 


组 1 组 2 组 3 
成 功 失败 成 功 失败 成 功 失败 
治疗 10 1 9 0 8 0 
控制 12 1 11 1 7 3 


因为 p [KR Y 83725 i 组 病人 成 功 的 概率 ， 所 以 用 右边 检验 : 


11-22 9.20 8-15 
E (10 +9 + 8) | 74 E +815) 
= 
11.22.13.2 9-20-12-1_ 8-15-10:3 
242.23 212.20 182.17 
_ 1.6786 _ 
11719 ` 14323 


从 表 Al PAA, T, 没有 超过 0. 95 分 位 数 1. 6449， 所 以 接受 零 假 设 . 把 T, 的 分 子 
减 去 0.5， 得 到 工 的 连续 修正 是 1.0057， 从 而 可 找到 p- 值 ， 从 表 Al 中 得 到 右边 p- 
值 是 0. 157. 

显然 在 本 例 中 列 总 和 是 随机 的 ， 用 T, =1. 4690 可 以 得 到 一 个 更 精确 的 检验 ， 得 
到 的 右边 P- 值 是 0.071， 这 说 明了 在 随机 行 总 和 或 随机 列 总 和 ， 或 行列 总 和 同时 随 
机 的 情况 下 ， 用 7; 更 恰当 . 然而， 零 假设 在 a =0. 05 时 仍 被 接受 . = 
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口 理 论 ” 对 每 一 个 列 联 表 的 第 一 行 ， 第 一 列 求 和 可 以 得 到 的 分 子 值 ， 也 就 是 Fisher 
精确 检验 统计 量 T, ， 然 后 像 T, 那样， 减 去 它 的 均值 ， 除 以 它 的 标准 差 (方差 开 方 ). 
由 中 心 极限 定理 可 得 ，T, 渐 近 于 标准 正 态 分 布 . 

按照 T, 的 形式 ， 重 新 排列 T. ， 可 得 到 统计 量 五 ,了 5; T, 的 唯一 不 同 是 分 母 用 
N 代替 了 N -1. 那么 仿照 前 面 的 推导 过 程 ， 可 以 证 明 T, ESAN. 

典型 的 连续 修正 是 取 离 散 随 机 变量 相 邻 值 之 间距 离 的 一 半 ， 国 为 行列 总 和 没有 
改变 ， 所 以 五 T, 的 分 子 按照 一 个 单位 分 隔 取 值 时 ， 分母 仍 为 常数 .因此 分 子 中 半 
个 单位 的 连续 修正 是 合适 的 . 

但 是 ， 若 行 总 和 或 列 总 和 是 随机 的 ，T, 和 五 的 分 母 就 会 有 很 多 不 同 的 值 ， 同 样 
Hh, T, AT, 也 就 有 很 多 不 同 的 值 ， 这 些 值 不 是 平均 间隔 的 ， 一 个 连续 修正 几乎 不 可 
能 计算 ， 并且 比 0.5 小 得 多 ， 这 种 情况 下 可 不 做 任何 修正 .当然 ， 通常 所 推荐 的 0. 5 
的 修正 太 大 了 ， 多 数 情形 下 会 给 出 真实 概率 的 相当 糟糕 的 估计 .参考 Pearson(1947 ) ， 
Plackett( 1964 ) , Grizzle ( 1967 ) 和 Conover ( 1974 ) 对 这 一 结论 的 支持 . 关于 Mantel- 
Haenszel 检验 的 更 多 信息 可 以 参考 Li, Simon 和 Gart(1997) 及 Breslow 和 Liang 
(1982). 口 

遵循 3. 1 节 中 描述 的 步骤 ， 任 何 同 2 x2 列 联 表 或 者 任何 与 列 联 表 相关 的 未 知 概 
率 的 置信 区 间 都 可 以 得 到 同样， 只 要 假定 合理 ， 检 验 的 假设 恰当 ，3. 1 中 的 检验 就 
可 以 用 于 列 联 表 . 

单 边 检验 的 一 个 简洁 法 则 可 以 参考 Ott 和 Free(1969)， 关 于 连续 修正 的 进一步 探 
讨 可 以 参考 Mantel 和 Greenhouse( 1968 ) Pirie 和 Hamdan( 1972 ) ，Maxwell( 1976 ) , 
检验 功效 的 讨论 见 Harkness 和 Katz(1964 ) ， 精 确 检验 的 探讨 可 参考 Gail 和 Gart 
(1973), Garside 和 Mack( 1976) 及 Madonald Davis, Milliken( 1977). 合成 几 个 2 x 
2 列 联 表 检验 统计 量 方 法 参见 Radhakrishna( 1965 ) Nelson( 1966), Meeker( 1978 ) , 
和 Zelen( 1971). 很 多 文章 讨论 了 由 于 误 分 带 来 的 边际 总 和 的 可 能 误差 ， 其 中 有 Chi- 
acchierini 和 Arnold( 1977 ) 及 Plackett( 1977). 其 他 相关 的 论文 可 参考 Fienberg 和 Gil- 
bert( 1970), Upton 和 Lee(1976) 及 Ray(1976). Fleiss(1973) 的 一 本 优秀 的 著作 里 主 
要 讨论 了 2 x2 列 联 表 的 情形 . 


习题 


1. 为 了 评估 公众 对 决议 立法 的 反应 ， 从 两 个 总 体 中 各 抽取 含有 135 人 的 随机 样本 .第 一 个 
样本 中 有 43 人 “反对 ”; 第 二 个 样本 中 有 37 A “RI”. 是 不 是 两 个 总 体 中 “反对 ”的 
人 数 所 占 比 例 不 同 ? 与 3. 5 节 习 题 1，2 作 比 较 ， 在 可 能 的 情况 下 ， 可 提出 两 个 样本 中 用 
相同 的 人 的 好 处 吗 ?” 如 “前 ”和 “后 ”两 种 情况 ， 

2. 60 个 学 生 被 平均 分 到 两 个 班级 (每 班 30 人 ) 中 学 习 如 何 编写 计算 机 程序 ， 一 个 班级 采用 
传统 的 学 习 方 法 ， 另 一 个 班级 采用 试验 性 的 新 方法 ， 在 课程 结束 后 ， 每 个 学 生 都 参与 纺 
程 测试 ， 程 序 要 么 正确 ， 要 么 错误 ， 结 果 列 表 如 下 : 
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正确 程序 ”错误 程序 
传统 班 23 7 
试验 班 27 3 

有 理由 相信 试验 性 方法 优 于 传统 方法 吗 ? 或 者 前 面 的 差异 可 能 是 因为 偶然 的 波动 吗 ? 
100 个 男人 和 100 个 女人 参与 试用 新 牙膏， 并 说 出 他 们 是 否 喜 欢 这 种 牙膏 32 个 男人 和 26 
个 女人 说 他 们 不 喜欢 这 种 牙膏 .这 是 否 说 明 大 体 上 男人 与 女人 的 偏好 有 差异 ? 
列 联 表 可 以 用 来 描绘 度量 尺度 高 于 名 义 尺度 的 数据 ， 例 如 ， 一 个 20 个 观测 样本 随机 抽 自 
美国 公民 的 毕业 生 ， 他 们 的 平均 等 级 分 数 如 下 : 

342 354 321 363 322 380 370 320 3.75 3.31 

386 400 286 292 359 2.91 377 270 3.06 3.30 
并 且 ， 另 外 一 个 20 个 观测 样本 随机 抽 自 非 美国 公民 的 毕业 生 ， 他 们 的 平均 等 级 分 数 如 下 : 

350 400 343 385 384 321 358 394 348 3.76 

387 293 400 337 3.72 400 3.06 3.92 3.72 3.91 
检验 零 假设 : 美国 公民 的 毕业 生平 均等 级 分 数 为 3. 50 或 更 高 的 毕业 生 比 例 与 非 美国 公民 
毕业 生 的 比例 一 样 . 
Fisher 的 精确 检验 可 以 快速 地 检验 两 个 变量 X，Y 的 相关 性 ， 每 一 个 变量 至 少 有 一 个 度量 
的 须 序 尺度 . 在 X 的 中 位 数 处 垂直 作 一 条 直线 ， 在 Y 的 中 位 数 处 平行 作 一 条 直线 ， 将 N 
个 (X,Y) 值 的 散 点 图 分 成 4 部分， 然后 计算 每 一 块 中 所 含 点 的 个 数 . 注意 行 总 和 与 列 总 
和 是 N/2， 所 以 不 是 随机 的 ， 
假设 X 为 丈夫 结婚 的 年 龄 ，Y 为 他 的 父亲 结婚 的 年 龄 ， 共 有 16 对 观测 值 ， 两 结婚 年 龄 都 
在 中 位 数 以 上 的 有 7 对 ， 这 两 个 变量 是 否 正 相关 ? 
仿 习 题 5， 对 例 3. 5. 4 中 的 数据 用 Fisher 精确 检验 来 检验 正 相 关 性 ， 记录 10 个 病人 对 药 
物 1 (X) 和 药物 2 (Y) 的 反应 数据 如 下 ; (0.7,1.9), ( -1.6,0.8), ( -0.2,1.1), 
(Ll {0.8,1.6), (0.0,4.6), 
(2.0,3.4) 
比较 用 Fisher 精确 检验 得 到 的 p- 值 和 用 3.5 节 中 作为 相关 性 检验 的 Cox 和 Stuart 检验 得 到 
的 p-fË. 
怀疑 工作 中 长 期 接触 麻醉 剂 氧化 所 是 使 怀孕 护士 和 助理 牙医 流产 的 原因 . 以 下 数据 来 自 3 
组 不 同 的 怀孕 女性 , 它 记 录 了 流产 的 和 足 月 分 娩 的 人 数 . 

牙医 助理 手术 室 护士 门诊 护士 
流产 足 月 流产 足 月 流产 足 月 


«x oe] e eee 
vax T 

(a) H T, 来 检验 这 个 论断, 求 p- 值 时 用 连续 性 修正 . 

(b) T, 来 检验 流产 不 是 受 氧 化 氮 影 响 的 假设 ,比较 (a) ,(b) 的 p- 值 . 

(c) 这 个 案例 中 用 T, 或 T, ,哪个 分 析 更 合理 ? 

(a) 一 所 大 学 去 年 接 到 21 位 男性 和 63 位 女性 的 求职 信 , 结 果 聘 用 了 10 位 男性 与 14 位 女 
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性 ,比例 分 别 为 48% 和 22% . 这 所 大 学 聘用 男性 的 概率 是 否 比 聘用 女性 的 概率 更 大 (用 
Fisher 精确 检验 )? 
(b) 根 据 学 院 详细 分 类 的 数据 如 下 : 


教育 学 院 管理 学 院 工程 学 院 
申请 者 。 被 聘 被 拒 被 聘 


被 拒 被 聘 被 拒 
s [2 | C J [° | ° — 
# [= | # JT 


这 所 大 学 聘用 男性 的 概率 是 否 比 聘用 女性 的 概率 更 大 (用 Mantel - Haenszel 检验 )? 
(c) (a),(b) 中 结论 有 差异 的 原因 是 什么 ? 试 讨论 之 . 


思考 题 


l. 在 概率 差异 检验 中 , 当 n =2,n, =3 时 , 求 出 检验 统计 量 的 精确 概率 分 布 . 令 T, 的 最 大 值 对 
应 临界 域 ,并 求 出 a 

2. 本 节 的 数据 可 以 看 成 从 总 体 1 和 总 体 2 中 抽取 的 两 个 独立 样本 ,分 别 包含 观测 X ,X, ,… X, 
和 六 2, 如果 观 测 在 类 1 中 , 则 每 个 X, 或 Y, 为 0, 如 果 在 类 2 中 , 则 为 1. 因此 每 个 样 
本 就 是 一 组 0 和 1. 对 两 个 独立 样本 问题 的 参数 方法 就 是 用 "两 样本 上 检验”, 其 统计 量 为 : 


pa X-Y [nino(ni + n> — 2) 
v n S + nxS H) + n> 


这 里 X,Y 是 两 样本 的 样本 均值 ,8 ,8 是 两 样本 的 样本 方差 . 证 明 + 和 九 ((1) 式 ) 的 关系 如 下 : 


或 等 价 为 


Sa | m+m 
I n) + n> — 2 + t 


这 种 关系 表明 ,如 果 +t 和 TT 的 临界 域 一 致 ,对 于 较 大 的 1 拒绝 H, ,等 价 于 对 较 大 的 7 拒 
绝 Hy. 
3. 考虑 nn =10 和 n,=4 的 两 个 随机 样本 ,检验 问题 Hp, =p. ,Hi p SP 为 左边 检验 ， 观 测 
值 的 2 x2 列 联 表 如 下 : 
类 1 类 2 


(a) 计算 检验 统计 量 7T. 

(b) 对 nm =10 和 n, =4, 找 4 个 列 联 表 使 T 值 更 小 《更 负 )、 还 能 找到 多 于 4 个 列 联 
表 吗 ? 

(c) 用 (4) 式 ， 求 出 精确 的 p-f, B: (b) 中 观测 数据 表 的 概率 和 多 于 4 个 表 的 概率 ， 
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它 是 假设 H, 下 共同 概率 p = p, =p, 的 函数 . 

(d) 将 p=0.3 代 入 (c) 中 所 得 的 概率 等 式 中 ， 求 左边 检验 中 与 观测 表 相关 的 p- 值 . (# 
示 : 应 得 到 p=0.012， 如 本 节 所 做 的 那样 ) 

(e) 分 别 将 p<0.3 和 p>0.30 的 一 个 值 代入 (ce) 中 所 得 的 概率 等 式 中 ,说明 在 p =0.3 


处 p- 值 最 大 . 
4. WT, T, 具有 如 下 关系 式 : 


4.2 rxc 列 联 表 


将 上 节 的 2 x2 列 联 表 直 接 推 广 到 具有 7r 行 c 列 的 列 联 表 ， 即 rxc 列 联 表 ， 同 上 
节 一 样 ，r xc 列 联 表 可 以 用 来 描绘 包含 几 个 样本 的 数据 ， 这 里 的 数据 至 少 表示 一 个 
度量 的 名 义 尺度 ， 也 可 以 用 来 检验 概率 不 随 样 本 改变 而 改变 的 假设 ，r xc 列 联 表 的 
另 一 个 用 途 是 用 于 单个 样本 ， 这 个 样本 中 的 每 个 元 素 根据 一 种 标准 可 以 归 人 了 个 不 同 
类 之 一 ， 同 时 也 可 以 根据 另 一 个 标准 归 入 c 个 不 同类 之 一 ， 在 统计 分 析 中 视 这 两 种 用 
途 一 样 ， 但 是 由 于 它们 存在 根本 的 差异 ， 所 以 需要 将 两 种 情形 分 别 讨论 。 本 节 也 将 
讨论 第 三 种 应 用 ， 它 类 似 于 前 两 种 . 

首先 考虑 将 上 节 介 绍 的 两 样本 的 应 用 扩展 .现在 我 们 把 两 个 样本 推广 成 个 样 
本 ， 每 个 样本 为 > 行 中 的 一 行 ， 每 个 样本 的 每 个 观测 可 以 由 前 面 的 两 类 〈 类 1， 类 2) 
推广 到 归 人 ec 类 ， 对 应 着 c 列 ， 于 是 可 将 第 i 个 样本 的 第 j 个 值 填 人 (i, j) 格 (第 i 
行 , 第 j 列 ) 中 ， 因 为 行列 数目 多 ， 所 以 上 节 的 单 边 假设 不 再 适用 ， 因 此 从 上 面 推广 
到 rxc 情形 时 ， 我们 仅仅 考虑 双边 备 择 假设 及 检验 统计 量 是 T, 的 平方 . 
> 概率 差异 的 Xx" 检验 ,rr xc 情形 
数据 ”共有 7r 个 总 体 ， 从 每 个 总 体 中 抽取 一 个 随机 变量 ， 记 第 i 个 样本 含有 的 观测 数 
Xn, 1<i<r， 每 个 样本 的 每 个 观测 可 以 归 入 c 个 不 同类 中 的 一 类 . 记 0 为 样本 i 
的 观测 归 入 类 j 的 数目 ， 所 以 ， 

ni=0a+0On+: +0 对 所 有 i (1) 
将 数据 排列 成 以 下 rxc 列 联 表 中 . 
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所 有 样本 的 观测 总 数 记 为 N. 
N =n + n> + : ` :+n, (2) 
第 j 列 中 的 观测 数 记 为 C,， 即 C, 是 所 有 样本 在 第 j 列 中 的 观测 总 数 . 
C= Oy t+ Oy + - - :+Ou 对 j=12,...,c (3) 
假定 条 件 


1. 每 个 样本 都 是 一 个 随机 样本 . 

2. 不 同样 本 的 输出 结果 是 相互 独立 的 《特别 对 样本 之 间 ， 样 本 之 内 由 假设 条 件 
1 知 是 独立 的 ). 

3. 每 个 观测 只 能 归 入 c 类 中 的 一 类 中 
检验 统计 量 给 定 检验 统计 量 为; 

SSU D j g (4) 
i=1 j=} ij 

这 时 如 果 H, 为 真 ，0, 代 表格 (i,j) 的 观测 数 ，E, 代 表格 (i,j) 期 望 的 观测 数 ， 即 
如 果 H, 为 真 ， 格 (i,j) 的 观测 数 应 接近 第 i 个 样本 大 小 n, 与 所 有 观测 归 入 j 类 的 比 
例 C/N 的 乘积 ， 注 意 在 2 x2 情形 下 ， 因 为 仅仅 考虑 双边 备 择 假设 ， 这 里 的 了 等 于 
上 节 的 TY. 

为 了 方便 计算 ,我 们 给 出 了 的 一 个 等 价 的 表达 式 : 


lap p P N (8) 


零 分 布 了 的 零 分 布 是 渐 近 自由 度 为 (r-1) (c-1) 的 Xx 分 布 . x 分 布 值 见 表 A2. 
T 的 精确 分 布 很 难 算出 ， 所 以 几乎 不 用 . 

如 果 E, 在 检验 统计 量 中 不 是 很 小 , 好 近似 是 很 好 的 .一 般 来 说 ， 如 果 所 有 的 E, 
大 于 0.5 且 至 少 一 半 的 已 大 于 1.0， 则 妇 近似 效果 较为 满意 ， 但 若 存在 一 个 E, 小 于 
0.5 或 大 多 数 的 已 小 于 1.0 BF, 好 近似 就 未 必 精 确 了 ， 但 此 时 我 们 可 以 将 行 或 列 加 和 
起 来 以 便于 去 除 那些 值 很 小 的 情况 ; 或 者 去 除 有 很 小 观测 值 的 行 或 列 . 
假设 “ 记 p, 为 随机 取 到 第 i 个 总 体 划分 为 第 j 个 类 的 概率 ,i=1,2,…,r,j=1,2,*…c. 

Ho: 同一 列 中 的 所 有 概率 相等 ( 对 任意 j, Py = py = = Pi). 

Hi: 每 列 中 至 少 存在 两 个 概率 相等 即 对 于 给 的 j 存 在 一 对 i 与 ,使 得 Py pu). 

注意 ， 没 有 必要 来 规定 各 种 概率 ， 零 假设 只 表述 对 所 有 总 体 归 信 第 j 类 的 概率 是 
相同 的 ， 无论 这 概率 是 什么 ， 也 不 管 我 们 考虑 的 是 嘟 一 个 类 型 . 

因为 计算 了 的 精确 分 布 很 困难 ， 我 们 用 大 样本 (这 里 ERAK) 分 布 通 近 去 找 临 
界 域 ， 在 近似 水 平 a 下 的 临界 域 对 应 于 了 值 大 于 X.。， 这 里 X,_。 是 自由 度 为 (+ -1) 
(c ~1) 的 x 分 布 的 1-a 分 位 数 ， 它 可 由 表 A2 Aki TAKEX. At, JE H, B 
则 接受 H,. 

p- 值 是 自由 度 为 (r-1)(c-1) 的 x 随机 变量 大 于 7 的 概率 ， 可 查 表 A2 获得 . 
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计算 机 辅助 ”Minitab，S-plus，SAS，Statxact 都 可 以 做 这 个 检验 ， 有 些 程序 可 分 析 比 
本 书 更 为 复杂 的 列 联 表 ， 一 -人 
评注 (E, 较 小 的 情形 ) 


因为 使 用 了 渐 近 分 布 ， 如 果 E, 适 当 大 ，a 的 近似 值 就 很 接近 a 的 真 值 ， 然 而 ， 


如 果 某 些 E, 较 小 时 ， 这 种 近似 效果 可 能 非常 差 . 


Cochran( 1952) 发 现 ， 如 果 存 在 E, 小 于 1 或 者 超过 20% 的 EE 小 于 5， 那 么 这 种 


近似 可 能 很 差 . 但 根据 很 多 学 者 未 发 表 的 研究 表明 ， 这 近乎 太保 守 了 .其 中 包括 
B. L. Vander Waerden 的 学 生 和 Oscar Kempthorne 的 学 生 的 一 些 研 究 ,以 及 Roscoe 和 
Byars(1971 ) 年 的 文章 ， 如 果 与 c 不 太 小 的 话 ， 我 认为 即使 一 些 E F 0.5, 但 
大 部 分 的 媚 大 于 1， 检验 也 可 以 是 有 效 的 . 如果 一 些 E, 值 太 小 ， 可 合并 几 个 类 去 
消除 E; 太 小 的 影响 ， 需 要 决定 的 是 哪 一 些 类 需要 合并 . 一 般 来 说 ， 如 果 茶 些 类 在 
某 些 方 面 很 相似 ， 我们 就 可 合并 它们 而 保留 了 原 假设 的 意义 . 


例 4. 2.1 
随机 地 从 私立 中 学 与 公立 中 学 里 抽取 一 些 学 生 进 行 标准 测验 ， 得 到 如 下 结果 . 
测验 分 数 
0-275 276-350 351-425 426-500 总 和 


us [o mr 4 
公立 中 学 3 | 32 17 3 82 
总 和 36 46 34 12 128 
为 检验 零 假设 私立 中 学 与 公立 中 学 的 学 生 的 分 数 服从 相同 的 分 布 ， 我 们 可 用 概率 
的 差异 性 检验 .近似 水 平 a =0.05 下 的 拒绝 域 对 应 于 了 大 于 7.815 的 值 ， 这 从 A2 
表 得 到 ， 其 中 入 分 布 的 自由 度 是 (r-1)(c-1)=(2-1)(4-1) =3. 
用 (4) 式 计算 已 ;的 值 如 下 : 


注意 ， 这 里 E, 满 足 Cochran 的 条 件 ， 也 值得 注意 的 是 E, 行 列 的 和 总 是 与 0 行列 的 


和 相同 . 这 对 检查 计算 是 有 用 的 . 
对 于 第 一 行 ， 第 一 列 所 在 的 格子 ， 我们 有: 
(Oj — Ei)? Ch En)? (6 一 129) _ 47.61 
E; En 29 129 


对 其 他 格子 可 进行 同样 的 计算 ,结果 如 下 : 


= 3.69 
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T = 3.69 + 0.38 + 1.89 + 5.14 
+ 2.06 + 0.21 + 1.06 + 2.87 
=17.3 
因为 T=17.3 大 于 7. 815. 所 以 我 们 拒绝 零 假 设 ， 事实 上 ， 在 0. 001 这 么 小 的 显著 性 
水 平 下 ， 我 们 也 可 以 拒绝 零 假 设 ， 故 p- 值 大 致 为 0. 001. 
结果 是 私立 中 学 与 公立 中 学 的 测试 分 数 的 分 布 是 不 同 的 . E 

在 例 4.2. 1 中 的 数据 (分 组 前 的 测试 分 数 ) 至 少 是 度量 的 顺序 尺度 ， 一 个 强 于 

度量 名 义 尺 度 的 尺度 对 测试 分 数 所 用 的 检验 可 能 更 合适 ， 如 果 感 兴趣 的 备 择 假设 是 
私立 中 学 的 学 生 比 公立 中 学 的 学 生 可 获得 较 高 ( 低 ) 的 分 数 ， 则 我 们 可 用 基于 秩 的 
更 有 效 的 检验 ， 比 如 下 一 章 中 介绍 的 Mann-Whitney 检验 . 然而 ， 本 例 中 的 备 择 假设 
包含 了 所 有 类 型 的 差异 ， 比 如 高 分 ， 低 分 ， 分 数 内 的 小 变异 ， 分 数 内 的 大 变异 等 等 ， 
所 以 这 里 用 x 检验 更 恰当 . 
口 理论 仿照 上 节 2 x2 情形 ， 可 以 找到 7 xc 情形 中 工 的 精确 分 布 ， 即 令 行 总 和 (#E 
本 大 小 ) 保持 常数 ,然后 列举 所 有 可 能 的 具有 相同 行 总 和 的 列 联 表 ， 对 每 一 行 用 多 
项 分 布 计算 它们 的 概率 ， 列 总 和 可 以 随 表 的 不 同 而 不 同 , 但 是 行 总 和 不 能 变 ， 这 一 
点 是 和 下 面 将 要 描述 列 联 表 应 用 的 本 质 区 别 . 在 以 下 的 应 用 中 ， 没 有 固定 行 总 和 ， 
因此 ， 有 很 多 可 能 的 列 联 表 ， 仅 要 求 对 所 有 表 都 有 一 样 的 观测 总 数 N， 并 且 提 一 下 第 
3 种 变化 ， 在 这 种 应 用 中 ,行列 总 和 都 不 随 表 的 变化 而 变化 ， 是 固定 的 ， 因 此 可 能 列 
联 表 的 数量 被 大 大 缩减 ， 精 确 的 分 布 也 更 容易 求 得 . 

在 本 节 列 联 表 的 3 种 应 用 中 ，7 的 渐 近 分 布 是 一 样 的 ， 都 是 自由 度 为 (r-1) 
(c-1) 的 好 分 布 ， 因 此 可 用 这 个 分 布 来 给 a 一 个 近似 值 ， 而 不 必需 要 知道 精确 的 列 
表 值 ， Cramér( 1946 ) 推导 出 了 渐 近 分 布 . 口 

对 于 含有 容量 为 N 的 单个 随机 变量 ， 每 个 观测 可 以 根据 两 个 准则 来 分 类 的 情形 ， 
可 以 用 r xc 列 联 表 ， 这 也 是 rr xc 列 联 表 的 第 二 种 应 用 .由 第 一 个 准则 产生 rr 类 
( 行 )， 由 第 二 个 准则 产生 c 类 ( 列 )， 将 每 个 观测 按照 两 条 准则 分 类 后 , 填 入 rxc 
列 联 表 的 一 个 对 应 的 格子 中 去 . 归 入 的 格 表示 属于 该 格子 的 观测 数 ， 尽 管 会 用 较 高 
的 度量 尺度 ， 但 一 个 度量 至 少 需要 是 名 义 尺 度 . 假设 检验 是 一 种 独立 性 的 检验 ; 繁 
蒙 一 点 地 说 ， 零 假设 为 行 与 列 代 表 了 两 个 独立 的 分 类 方案 . 下面 我 们 给 出 更 精确 的 
描述 . 


p 独立 性 的 Xx? 检验 


数据 ”已 知 一 个 容量 为 N 的 随机 样本 ， 它 的 观测 值 根据 两 个 准则 划分 成 几 类 .按照 
第 一 个 准则 ， 每 个 观测 可 归 入 + 类 ( 行 ) 中 的 某 一 类 ， 按照 第 二 个 准则 每 个 观测 可 
HAc% ( 列 ) 中 的 某 一 类 ， 记 0, 为 第 i 行 第 j 列 的 观测 数 ， 将 其 填 和 人 r xc 列 联 表 
中 ， 记 第 i 行 的 观测 总 数 为 R,，( 代 替 前 面 检 验 中 的 n;,， 是 为 了 强调 行 总 和 是 随机 的 
而 不 是 固定 的 ) ， 记 第 了 列 观测 总 数 为 C;,， 所 有 格 中 总 的 观测 数 为 入 . 
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列 
1 2 3 C 总 和 
行 1 Ri 
2 R, 
r R, 
总 和 N 


假定 条 件 

1. 观测 为 的 样本 是 随机 的 (每 个 观测 归 入 第 i 行 第 j 列 的 概率 相同 ， 并 且 同 
其 他 观测 独立 ) 

2. 按照 第 一 个 准则 ， 每 个 观测 可 归 入 + 类 ( 行 ) 中 的 某 一 类 ， 按照 第 二 个 准则 ， 
每 个 观测 可 被 归 入 c 类 ( 列 ) 中 的 某 一 类 . 
检验 统计 量 令 : E; =R,C/N， 则 给 出 检验 统计 量 如 下 
e (O; — E i 
或 者 为 了 手 算 的 方便 ， 

> (7) 
=] j=1 


这 里 的 求 和 是 对 列 联 表 的 所 有 格子 求 和 . 注意 ， (6) 和 (7) 式 与 前 面 (4) #l (5) 
式 两 种 检验 形式 相同 . 
零 分 布 ”正如 前 面 的 检验 ,TT 的 零 分 布 可 以 通过 自由 度 为 (r-1) (c-1) 的 x 分 布 
(可 以 在 表 A2 中 查 到 ) 来 近似 . 7 的 精确 分 布 难以 求 得 ， 因 此 几乎 不 用 . 

正如 前 面 的 检验 ， 如 果 所 有 的 E, 都 大 于 0.5， 并且 至 少 有 一 半 E; 大 于 1.0， 那 么 
y 近似 通常 是 令 人 满意 的 . 将 总 和 较 小 的 行 或 列 与 其 他 描绘 相似 特征 的 行 或 列 合并 ， 
或 者 简单 删除 几乎 不 包含 观测 的 行 或 列 ， 可 以 消除 小 的 E; 的 影响 . 
假设 

H,: 对 任意 的 i,j， 事件 “一 个 观测 值 在 行 i” 与 事件 “同样 的 观测 在 列 j” 是 
独立 的 . 
通过 事件 独立 性 的 定义 ，AH, 可 以 表述 如 下 : 

Ho: P( 行 i, 列 站 =P( 行 让 ' P( 列 让, 对 所 有 的 i,j 
备 择 假设 可 以 方便 地 表述 为 : 
H: P( 行 i, #|j) APAT b POND, H i, j 

查 表 A2， 如 果 了 超过 自由 度 为 (r-1)(c-1) 的 * 分 布 随机 变量 的 1 - a 分 位 数 ， 则 
拒绝 HH,， 置 信 水 平 为 a。p- 值 (自由 度 为 (r-1)(c -1) 的 一 个 服从 x 分 布 的 随机 变 
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量 超过 观测 值 7 的 概率 ) 也 可 以 从 表 A2 中 查 到 . 

计算 机 辅助 ”本 检验 可 用 Minitab S-Plus , SAS 和 StatXact 操作 完成 ， 这 些 软件 里 的 一 

些 程序 还 可 以 分 析 比 本 书 中 更 复杂 的 列 联 表 ， 一 F  —F 
例 4. 2. 2 
将 某 个 大 学 里 学 生 作为 一 个 样本 ， 根 据 他 们 被 录取 的 院 系 和 是 否 从 州 内 或 州 外 的 高 
中 毕业 两 个 标准 来 分 类 .将 结果 填 人 到 如 下 2 x4 列 联 表 中 ， 


aa 工程 学 院 ”艺术 与 科学 学 院 ”国内 经 济 学 院 。 其 他 总 和 


W ee S S 5 CP 
| 


30 20 23 21 94 


为 了 检验 零 假 设 ， 每 个 学 生 被 录取 的 院 系 与 他 们 是 否 在 州 内 还 是 州 外 读 高 中 独立 ， 
我 们 选择 x 独立 性 检验 来 检验 这 个 假设 ，N=4 查 表 A2， 自 由 度 为 (r-1)(c-1) = 
3 的 好 分 布 随机 变量 的 0.95 分 位 数 为 7.815， 故 近似 水 平 为 0.05 的 拒绝 域 是 
(7.815, ) ， 因 此 a 近似 于 0. 05. 
用 (6) 式 算出 了 为 : 
T=1.52 


因此 可 以 接受 零 假 设 ， 从 表 A2 中 查 到 p- 值 大 于 0. 25. Bi 
口 理论 ”我 们 可 以 给 出 相对 简单 情形 N =4 时 的 了 的 精确 分 布 ， 令 pi 是 一 个 观测 归 入 
第 i 行 第 j 列 的 概率 ，( 注 意 这 里 的 下 与 前 面 检验 中 的 py 不同 ， 所 有 格子 中 的 py 之 和 
是 1， 而 前 面 检验 中 的 p, 每 一 行 加 起 来 为 1)， 则 有 如 下 特殊 结果 


列 
1 2 
行 1 jo|b 
nl 
N 
的 概率 可 以 用 多 项 式 分 布 求 得 : 
pr (Pn) (pra)t(pa) Pa (8) 


因为 N 个 对 象 能 导出 以 上 列 联 表 的 个 数 由 多 项 式 系数 -了 7! 给 出 ， 并 且 每 个 结果 


的 概率 为 : 

(pu)'(p12) (px) (p22) (9) 
零 假设 : 每 个 p, 等 于 它 的 行 概率 乘 上 列 概率 ， 当 为 真 时 ， 由 所 有 的 p, 相 等 (本 情 
形 中 p, =1/4， 这 个 结论 我 们 不 证 明 ) 可 得 了 的 右边 的 最 大 概率 . 因此， 对 每 种 可 能 


205 


207 
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的 排列 ， 通 过 计算 


| N 
P(E) “zas Q) m 
而 得 到 一 个 a， 对 N=4 的 情形 ， 我 们 可 以 找到 35 种 不 同 的 列 联 表 ， 这 些 表 及 其 发 生 
的 概率 与 了 值 都 在 图 4-1 中 列 出 ， 同 前 ， 我 们 定义 0/0 =0. 
P(T = 0) = 84/256 = 0.33 
P(T = 4/9) = 48/256 = 0.19 
P(T = 4/3) = 96/256 = 0.37 
P(T = 4) = 28/256 = 0.11 
如 果 临 界 域 对 应 着 最 大 的 T 值 ，T=4， 则 a=0.11, 同上 节 中 讨论 的 精确 分 布 的 双 
边 检 验 得 到 的 置信 性 水 平 a =0. 125 相 比 ， 差 异 不 是 很 大 .同上 节 中 N 固定 ， 行 总 和 也 
国定 下 得 到 的 分 布 相 比 ， 这 里 了 的 分 布 更 复杂 ， 原 因 是 这 里 可 能 的 列 联 表 方式 更 多 ， 


并 且 , TT 可 能 有 例外 值 ， 因 此 可 能 的 概率 分 布 也 改变 了 一 些 . 口 
尽管 两 种 应 用 下 的 了 的 精确 分 布 有 少许 差异 ,但 是 都 可 由 自由 度 为 (r -1)(c -1) 
的 Xx 分 布 近似 . 


列 联 表 的 第 三 种 应 用 中 ， 不 仅 行 总 和 为 固定 〈 同 第 一 种 应 用 一 样 ) ， 而 且 列 总 和 
也 固定 ， 因 此 较 前 面 介绍 的 两 种 应 用 T 的 精确 分 布 更 容易 求 出 ， 然 而 ， 除 非 有 辅助 
表 或 计算 机 的 帮助 ，T 的 精确 分 布 对 实际 应 用 来 说 仍 太 复杂 ， 所 以 我 们 建议 用 x 近 
似 来 求 临界 值 和 a 


> 固定 边缘 分 布 的 XY 检验 


数据 数据 归纳 入 一 个 + xc 列 联 表 中 ， 这 与 前 两 种 应 用 一 样 ， 不 同 的 是 这 里 的 行 与 
列 总 和 固定 而 非 随机 . 


列 


总 和 Ci C) wa 28 Ce N 
记 行 与 列 总 和 分 别 为 n, 和 cj， 这 种 记号 是 为 了 强调 行 与 列 总 和 是 固定 而 非 随机 的 ， 
观测 总 数 为 N. 


T=0 
结果 概率 
(174)4 
BID] 
(1/4) 
010| 
(17/4)4 
oja 
(1/4) 
4101 
31 41/494 
010; 
4(174)4 
Orn 
4(174)4 
1113| 
1I0| 4(1/4)4 
4(1/4)4 
oTo 
4(1/4)4 
013 
4(174)4 
3111 
4(1/4y4 
110| 
6(1/4)4 
ofo 
02 61/4} 
OO 61/4} 
212) 
210] 6(1/4)4 
210 
24(1/4)4 
总 和 = 84/256 


假定 条 件 


图 4-1 


T=4/9 
结果 概率 
12(1/4)4 
110) 

12(174)4 
olii 
12(1/4)4 
HA 
12(1/4)4 
211 
总 和 = 48/256 


1. 每 个 观测 只 能 归 人 一 个 格 中 . 
2. 观测 是 一 个 随机 样本 里 的 观测 ， 每 个 观测 落 入 (i, j) 的 概率 相同 . 
3. 行 与 列 总 和 是 固定 而 非 随 机 的 . 


4.2 

T=4/3 
结果 概率 
12(1/4)4 
011 
12(1/4) 
AL] 

OJ 121/44 
1j1| 12(1/4): 
210| 
2o) 12(0/⁄4)4 
1 11 


12 12(/⁄4y: 


11] 120/4 
02 

oi] 12(0174) 
总 和 = 96/256 


当 所 有 的 p; =1/4 BF, T 的 精确 分 布 


概率 
4(1/4)4 


4(1/4)4 
4(1/4)4 
4(1/4)4 
6(1/4)4 


6(1/4)4 


和 = 28/256 


t 
° 
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检验 统计 量 S E,=nc/N ARA (ij) 中 的 期 望 观测 数 ， 同 前 ， 给 出 检验 统计 量 如 下 : 
T= > $ (O, Ey/E, (11) 
1=1 j=1 


其 中 求 和 是 对 所 有 rc 个 格子 求 和 ， 注 意 ， 这 个 检验 统计 量 形式 同 前 面 所 用 的 两 个 相 
同 ， 所 以 为 了 计算 方便 ， 可 用 (5) ARE. 
零 分 布 ” 同 前 面 的 检验 一 样 ，T 的 零 分 布 可 以 用 自由 度 为 (r -1)(c-1) 的 x 分 布 近 
似 . 了 的 精确 分 布 虽然 比 前 两 种 检验 容易 求 得 ， 但 还 是 很 困难 ， 所 以 很 少 用 它 . 
同 前 面 的 检验 一 样 ， 如 果 所 有 的 E, 比 0.5 大 或 至 少 有 一 半 大 于 1.0, x 近似 通常 
是 令 人 满意 的 .可 将 一 些 特征 相似 ， 总 和 较 小 的 行 或 列 合 并 ， 或 简单 地 消去 几乎 没 
有 观测 值 的 行 或 列 来 消除 较 小 E, 的 影响 . 
假设 ”这 里 的 假设 可 以 取 本 节 前 两 种 应 用 中 的 两 组 假设 之 一 ， 但 行 与 列 总 和 必须 是 
固定 的 ， 或 者 取 适 应 特定 背景 的 假设 . 通常 这 种 假设 是 前 面 检 验 独立 性 假设 的 变化 ， 
见 下 面 例 4. 2.3 和 例 4. 2.4 根据 试验 所 做 的 特殊 修改 . 
车 T>x?_,((r-1)(c-1))， 则 拒绝 H,， 近 似 的 置信 性 水 平 为 a，p- 值 也 可 从 表 
A2 中 查 到 , p=p(X>T), X~x ((r-1)(c-1)). 
计算 机 辅助 ”可 在 Minitab ,S-Plus ,SAS 和 StatXact 中 进行 这 个 检验 ， 对 某 些 情形 ， 可 
通过 StatXact 求 出 精确 的 p- 值 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 < 
例 4.2.3 
ELE ERS IB y 检验 也 可 用 来 检验 两 个 随机 变量 X 和 Y 是 否 独 立 . 已 知 有 一 个 含 
有 24 个 点 的 散 点 图 ， 这 些 点 代表 了 二 元 随机 变量 (X,Y) 独立 的 观测 ， 可 将 图 4-2 
构建 成 列 联 表 ， 每 个 点 的 横 坐 标 是 随机 变量 XX 的 观测 值 ， 纵 坐标 是 Y 的 观测 值 ， 假 
设 每 对 观测 (X,Y) 是 相互 独立 的 ， 我们 希望 检验 如 下 问题 : 
Ho: X M Y 是 相互 独立 的 ，Hi:X 和 YY 是 不 独立 
为 了 形成 一 个 所 有 E, 都 相等 的 列 联 表 ， 我 们 注意 到 3 和 4 都 是 样本 容量 为 24 
的 因子 ， 因 此 我 们 用 虚线 将 图 4-2 中 两 点 平均 分 成 3 行 4 列 ， 即 每 行 有 8 个 点 ， 每 
列 有 6 个 点 (如 果 一 些 E, 很 小 ， 应 令 它们 几乎 相等 ,一 种 方式 是 行 总 和 相等 且 列 总 


和 相等 )， 这 样 得 到 的 列 联 表 如 下 : 
y 


ww — — — — — —|— — — — — — —| — — — — — — — — 


图 4-2 散 点 图 
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24 
近似 置信 性 水 平 为 0.05 的 临界 域 为 了 >xoos((2)(3)) =xw(6) =12.59 (由 表 A2 
获得 ) 的 区 域 . 
检验 统计 量 可 用 (11) RME, = (6) (8) /24 =2 计算 . 
— Ey)? (DO — 2)? 
T= 7 = SS — 


i=] j=1 ij i=] j=1 


= 14 (12) 
因为 T>12.59， 所 以 应 拒绝 H,, AMRIT AA X 和 Y 不 独立 ， 实 际 上 ， 可 以 
在 一 个 显著 性 水 平 小 到 0. 03 下 拒绝 H,, A p-fB 28 0. 03. E=: 


fJ 4. 2. 4 
一 位 心理 学 家 要 求 被 测 人 学 习 25 个 单词 ， 给 被 测 人 25 张 蓝 色 卡片 ， 每 一 张 上 有 一 
个 单词 ， 其 中 有 5 个 名 词 ，5 个 形容 词 ，5 个 副词 ，5 个 动词 和 5 个 介词 .她 必须 将 
这 些 蓝 色 卡 片 与 25 张 白色 卡片 配对 ,这些 白色 卡片 也 是 每 张 一 词 ， 并 且 词 性 与 每 
种 词性 所 包含 的 单词 数 同 蓝 色 卡片 一 样 (每 个 词性 ，5 个 单词 )， 人 允许 被 测 人 5 分 钟 
配 卡片 (1 张 白 卡片 和 每 张 蓝 卡片 ) ，5 分 钟 学 习 所 配对 的 单词 ， 然 后， 她 被 要 求 闭 
上 眼睛 并 且 一 个 一 个 地 给 她 读 白色 卡片 上 的 单词 ， 当 给 她 读 每 个 单词 时 ， 她 尽量 提 
供与 所 读 单词 相关 的 蓝 色 卡片 上 的 单词 . 

心理 学 家 并 不 关心 她 正确 回答 的 单词 数 ， 而 是 关心 配对 结构 以 检查 它 是 否 表 示 
一 种 次 序 ， 假 设 如 下 : 

Ho: 没 有 按照 词性 配对 

Hi: 被 测 人 倾向 于 将 蓝 色 卡片 上 的 某 一 种 词性 的 单词 与 白色 卡片 上 某 一 种 词性 (不 一 定 

相同 ) 的 单词 配对 . 
把 配对 结果 归 入 如 下 5 x5 列 联 表 : 
名 词 形容 词 副词 动词 介词 总 和 


Q wm tn tn (Q 


212 
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选择 固定 边际 总 和 的 x 检验 ， 测 试 者 认为 车 了 较 大 ， 表 明 H, 为 真 ， 边际 总 和 代表 
了 每 一 类 的 单词 数 ， 这 在 检验 前 已 经 是 确定 的 ， 近似 水 平 的 临界 域 为 了 > 26. 30 的 
区 域 ， 其 中 26. 30 =Xaw((r-1l)(c-1)) =xaw((4)(4)) =xow (16) (HÆ A2 获 
得 ), 用 (11) 式 可 以 得 到 了 的 观测 值 . 
Ey= =1 对 所 有 i 和 j 
5.5 , — 112 
= 人 (13) 
因为 T=66， 所 以 拒绝 H,, E3 H, 是 合理 的 ，p- 值 小 于 0. 001. Bi 
DEt ”在 上 节 2 x2 情形 下 ， 若 行 与 列 总 和 是 非 随 机 的 ， 则 可 以 找到 了 的 精确 分 布 为 
超 几 何 分 布 ， 其 概率 由 (4.1.6) 式 给 出 ， 现 在 我 们 列 出 2 x2 情形 下 了 的 精确 分 布 . 
车 行 总 和 与 列 总 和 都 等 于 2， 则 有 如 下 三 种 可 能 的 列 联 表 : 
表 概率 T 


ale 20., | 


OO 
9 


0., | 


因为 7 的 概率 分 布 是 惟一 的 ， 所 以 在 这 个 应 用 中 ，H, 是 简单 假设 . 

将 行 总 和 与 列 总 和 国定 ， 可 以 大 大 减少 可 能 的 列 联 表 数 目 ， 从 而 较 前 两 种 应 用 ，T 
的 精确 分 布 更 容易 找到 ， 若 + =2，c =2， 则 检验 即 为 “Fisher 精确 检验 ” ， 可 以 方便 地 使 
用 更 精确 的 概率 表 (Finney,1948) ， 程 序 化 的 Fisher 精确 检验 可 参考 Robertson( 1960). 

对 一 般 的 >，c， 固 定 边际 总 和 的 列 联 表 
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的 精确 概率 为 : 


(14) 


这 里 的 多 项 式 系数 同 1. 1 节 中 法 则 3 的 定义 . 口 
本 节 与 4.1 节 中 的 列 联 表 称 为 双向 列 联 表 (two-way contingency table), ， 原 因 是 
观测 被 分 成 行 与 列 两 个 方向 ， 自 然 的 推广 方式 为 ， 若 观测 按照 三 条 或 三 条 以 上 的 准 
则 进行 分 类 ， 那 么 数据 就 可 用 三 向 (或 多 向 ) 列 联 表 的 形式 进行 描述 . 
为 了 扩展 x 列 联 表 检验 ， 我们 将 双向 检验 统计 量变 换 为 如 下 形式 : 


R, Ci 
[il 


R. Cj 

NN 

它 具 有 (r-1l)(c=-1l) 的 自由 度 ， 在 一 个 r 行 ，c 列 和 + 上 块 的 三 向 列 联 表 中 ， 记 块 总 和 
为 B, ,k=1,2,…,t， 行 总 和 为 R,i=1,2,…,r， 列 总 和 为 C, j=1,2, 0, ANHAN 
测 总 数 ， 则 : 


Ts 95; 
ij N 


(15) 


Ri = > Oi {16) 
įk 

Ci 一 >; Oijk (17) 
Lk 


B; = 2 Ojjk (18) 
Lj 


这 里 0。 代 表 了 第 i 行 , 第 j 列 , 35 kR, MEWA Ep E 
行 - 列 - 块 相互 独立 的 假设 为 真 的 情况 下 ，E; 有 如 下 估计 : 


Eg = NON (19) 
并 可 用 检验 统计 量 
n — ELX 
r= On E (20) 
ij 


计算 ， 这 里 的 求 和 是 对 所 有 的 r: c 1 个 格子 求 和 .然后 用 和 自由 度 为 rct ~-r-c- 
1+2 的 好 分 布 来 做 显著 性 检验 ， 其 他 多 向 列 联 表 检验 可 类 似 推广 . 

所 谓 “ 对 数 线性 模型 ”的 方法 可 以 成 功 地 用 来 分 析 多 向 列 联 表 ， 它 将 在 本 章 的 
最 后 一 节 中 讨论 ， 关 于 多 向 列 联 表 的 更 详细 的 论述 可 参考 ; Goodman(1970 ) , Ireland , 
Ku 和 Kullback( 1969) , Ku, Varner 和 Kullback( 1971 ) ,Koch ,Johnson 和 Tolley ( 1972) ， 
Darroch( 1974) 和 Halperin et al. (1977). Maxwell(1961) 写 了 一 本 分 析 列 联 表 的 小 册 
子 ， 列 联 表 估 计 的 重要 课题 可 参考 Fienberg ( 1970a) McNeil 和 Tukey (1975), K 
Quade 和 Salama( 1975). 车 一 些 数据 仅仅 被 部 分 地 分 类 ， 可 参考 Chen 和 Fienberg 
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(1974) 或 Hocking 和 Oxspring(1974). 5.2 节 中 将 讨论 列 联 表 中 一 类 或 同时 两 类 有 自 
然 排 序 的 情形 ， 也 可 参考 Williams 和 Grizzle(1972 ) Simon(1974) 及 Clayton( 1974). 
等 列 总 和 与 固定 行 总 和 的 2 x3 列 联 表 检 验 统计 量 的 精确 分 布 可 参考 Bennett 和 
Nakamura(1963 ,1964) 及 Healy( 1969). Ireland 和 Kullback ( 1968 ) 对 给 定 行 与 列 总 和 的 
列 联 表 给 出 了 不 同 的 检验 ， 列 联 表 的 x 检验 的 功效 可 参考 Chapman 和 Meng( 1966). 
Mosteller( 1968 ) 关于 列 联 表 的 文章 是 一 篇 相当 优秀 、 可 读 性 极 强 的 调研 文章 . 
Haynam 和 Leone(1965 ) 给 出 了 了 的 精确 分 布 的 近似 .数据 误 分 可 参考 Mote 和 Ander- 
son(1965 ) 合 写 的 论文 . 讨论 有 小 频率 或 零 频率 格子 的 列 联 表 可 参考 Ku (1963) 和 
Sugiura 及 Otake (1968). 关于 交互 检验 的 信息 可 参考 Goodman( 1964 , 1968 ) 和 Bhap- 
kar 及 Koch( 1968). 一 类 双 变 量 列 联 表 型 分 布 可 参考 Plackett (1965), Mardia ( 1967 ) 
和 Steck(1968). 其 他 检验 列 联 表 的 方法 可 参考 Ishii( 1960), Gregory(1961), Clar- 
ingbold( 1961), Kullback, Kupperman, Ku(1962), Diamond(1963), Mielke 和 Sid- 
diqui( 1965), Hoeffding( 1965), ，Gart(1966 ) 和 Chacko( 1966 ). 很 多 关于 列 联 表 的 文 
章 都 举例 说 明了 这 种 分 析 的 实用 性 和 多 样 性 ， 比 如 可 参考 Elston(1970), Crowley 及 
Breslow( 1975), Light 和 Margolin( 1971), Margolin 和 Light(1974); 以 及 Shuster 和 
Downing(1976). Mantel 和 Haenszel(1959 ) 提出 了 一 种 有 用 的 检验 N 个 独立 的 2xr 
列 联 表 行 ~ 列 分 布 一 致 性 的 方法 . 其 他 列 联 表 的 应 用 将 在 本 章 其 余 几 节 中 讨论 . 
习题 
l. 检验 下 边 的 观测 是 否 表明 所 观测 的 两 个 变量 之 间 是 独立 的 ; (3.6,13), (4.7,19), (1.4, 
9), (5.5,15), (4.8,27), (4.3,14), (3.0,6), (4.2,11), (6.0,24), (6.8,26), (4.1, 
18), (3.2,9), {4.0,8), (1.9,6), (0.4,7), (4.9,14), (5.6,18) 和 (5.6,20). 用 这 一 
节 的 哪个 检验 ? 
2. 从 80 场 马赛 中 的 每 场 随机 挑选 出 一 匹 马 ， 并 根据 起 跑 位 置 和 马 冲 过 终点 线 的 位 置 (第 
一 ， 第 二 ， 等 等 ) 对 其 分 类 . 


马 在 赛跑 终点 的 位 置 依赖 于 它 的 起 跑 位 置 吗 ? 用 这 一 节 的 哪个 检验 ? 
3. 在 另 一 个 研究 中 ， 将 三 天 所 有 马赛 中 的 所 有 马 根据 起 跑 位 置 和 它们 赛跑 结束 的 次 序 来 
分 类 . 


8. 
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马 在 赛跑 终点 的 位 置 依赖 于 它 的 起 跑 位 置 吗 ? 用 这 一 节 的 哪个 检验 ? 
三 位 教授 讲授 统计 学 导论 的 大 班 课 . 在 学 期 期 末 ， 通 过 比较 成 绩 来 看 他 们 的 评分 方式 是 
否 有 显著 的 差别 . 


成 绩 
教授 A B C D F WP WE 


Smith 12 45 49 6 13 18 2 
Jones 10 32 43 18 4 12 6 
White 15 19 32 20 6 9 7 


这 些 有 显著 差别 吗 ? 你 用 的 是 哪 种 检验 ? Jones 教授 和 White 教授 所 给 的 分 数 有 显著 不 同 
吗 ? 结果 怎么 解释 ? 

将 美国 证 券 交 易 所 (ASE) 股票 的 一 个 随机 样本 和 纽约 证 券 交易 所 (NYSE) 股票 的 随机 
样本 进行 比较 ， 看 这 两 个 交易 的 百分率 是 否 有 区 别 . ASE 的 23 种 股票 中 有 11 个 A, 11 
个 B 和 11 个 C，NYSE 的 35 种 股票 中 有 24 个 A，11 个 B 和 没有 C， 你 的 分 析 如 何 ? 

一 个 观测 组 穿 过 一 片 从 林 区 ,他们 报告 了 所 有 真 的 和 假 的 伪装 设备 指示 .用 了 两 种 类 型 
的 伪装 ， 普 通 的 和 带 图 案 的 . 这 个 组 的 报告 包括 所 用 的 伪装 类 型 和 设备 的 位 置 ， 这 个 组 
被 一 位 知道 指示 真 假 的 人 监控 着 ， 真 假 指 示 的 结果 如 下 ， 


伪装 类 型 
带 图 案 的 ”普通 的 
错误 探测 的 个 数 14 4 
正确 探测 的 个 数 27 32 


被 报告 的 不 正确 指示 的 概率 有 显著 不 同 吗 ?( 注意 这 个 研究 并 不 解决 未 被 发 现 的 设备 和 被 

认错 伪装 类 型 的 指示 . ) 这 是 什么 类 型 的 列 联 表 ? 

将 30 个 毕业 生 的 随机 样本 依据 学 院 和 宗教 信仰 分 类 如 下 ， 学 院 和 宗教 信仰 有 关系 吗 ? 
艺术 和 科学 学 院 。 ”商学 院 工学 院 其 他 学 院 


天 主教 新 教 天 主教 新 教 
天 主教 天 主教 新 教 天 主教 
犹太 教 犹太 教 新 教 天 主教 
天 主教 犹太 教 新 教 其 他 
新 教 教 其 他 天 主教 
新 教 新 教 

其 他 其 他 天 主教 
新 教 犹太 教 
其 他 其 他 


一 电视 销售 公司 用 电话 追踪 对 其 不 同 产品 的 反映 ， 以 便 判 断 广 告 在 电视 中 播 出 的 时 间 是 
否 与 产品 销售 有 关 . 反映 的 个 数 如 下 ， 你 的 分 析 如 何 ? 这 里 需要 什么 样 的 假设 ? 
产品 
钓 杆 厨具 FCD 健身 器 
白天 6 73 55 7 


晚上 14 65 82 8 
周末 21 58 48 8 


N 
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思考 题 


1. 证 明 由 (4) AA (5) 式 给 出 的 两 种 形式 的 了 是 等 价 的 . 
2. ”证明 如 果 r=2, c=2, 那么 (4) 式 等 价 于 (4.1.1) 式 平方 


_ N(OnOn —- OrOx) 


si: ñnin,CICo 


3. 在 很 多 计算 器 中 找到 用 统计 量 
Tag Si > Oi ln (O;/ E;j) 
=1 j=l 
代替 了 的 一 种 不 同 的 分 析 列 联 表 的 方法 ， 这 里 In 是 自然 对 数 . 这 两 种 检验 程序 的 其 他 地 


方 完全 相同 .在 习题 3 中 用 T'， 看 所 得 的 结果 是 否 与 用 T 时 的 类 似 、( 一 般 来 说 ， 这 两 种 
检验 不 等 价 ， 尽 管 它们 在 特殊 情况 下 会 产生 类 似 的 结果 . ) 


4.3 中 位 数 检验 


中 位 数 检 验 是 用 来 验证 不 同 总 体 中 抽取 的 几 个 样本 是 否 有 同样 的 中 位 数 ， 事 
实 上 ， 本 章 的 中 位 数 检验 并 不 新 奇 ， 它 只 不 过 是 上 节 所 介绍 的 具有 固定 行列 总 和 
的 x 检验 的 一 种 具体 应 用 .因为 它 非常 有 用 ， 所 以 我 们 将 它 单独 提出 来 讨论 ，. 

为 了 检验 几 个 总 体 (c 个 ) 的 中 位 数 是 否 相 同 ， 我 们 从 每 个 总 体 中 抽取 一 个 样本 
(度量 尺度 至 少 是 顺序 的 ， 否 则 “中 位 数 ” 没 有 意义 . ) ， 然 后 构建 一 个 2 xc 列 联 表 ， 
使 第 i 列 有 两 个 元 紊 分 别 为 第 i 个 样本 中 高 于 和 低 于 总 中 位 数 ( 所 有 观测 的 中 位 数 ) 的 
两 个 观测 值 ， 然 后 对 此 列 联 表 用 通常 的 x 检验 . 


> 中 位 数 检验 
数据 ”从 c 个 总 体 中 各 取 一 个 容量 为 n,,i=1,2,…,c 的 随机 样本 ， 则 可 确定 联合 样 
本 的 中 位 数 ， 即 在 入 =n, +n,+…+n, 个 观测 中 ， 恰 有 一 半 的 观测 值 超 过 此 数 ， 我 
们 称 之 为 总 中 位 数 ( grand median). $ Q 为 第 i 个 样本 中 超过 总 中 位 数 的 观测 数 ， 
0Q; 为 第 i 个 样本 中 小 于 或 等 于 总 中 位 数 的 观测 数 ， 将 频数 排列 在 如 下 的 2 xc 列 联 
KP: 

样本 1 > PES c 总 和 


-epm [Ta Ts] < 
< 中 位 数 |o | o | > | o, b 


总 和 n, n; s. n, N 
ita, b 分 别 为 所 有 样本 中 大 于 总 中 位 数 和 小 于 或 等 于 总 中 位 数 的 观测 总 数 ， 则 
#a+b=N, N 为 观测 总 数 . 
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假定 条 件 

1. 每 一 样本 都 是 随机 的 . 

2. 样本 之 间 相 互 独立 . 

3. 度量 尺度 至 少 是 顺序 的 . 

4. 车 所 有 总 体 有 同样 的 中 位 数 ， 则 对 所 有 总 体 而 言 ， 一 个 观测 超过 总 中 位 数 的 
概率 相同 ， 记 为 p. 
检验 统计 量 将 上 节 给 出 的 检验 统计 量变 换 形式 ， 并 注意 在 行 数 为 2 的 特殊 情形 下 ， 
Ox =n, - Ol, 我 们 可 得 : 


(1) 
为 了 计算 方便 ， 可 采用 如 下 形式 : 
_N2.& Of Na 
ee (2) 
若 a 近似 地 等 于 b (除非 观测 中 有 很 多 等 于 总 中 位 数 ) ， 则 可 简化 检验 统计 量 ， 化 简 
后 的 形式 如 下 : 
2 
a = (3) 
若 a=b， 则 (3) 式 给 出 的 T 的 简化 形式 是 精确 的 ， 否 则 就 是 近似 的 . 
零 分 布 由 于 TT 的 精确 分 布 难以 求 得 ， 所 以 常 采用 大 样本 逼近 来 近似 了 的 分 布 ( 见 
本 节 后 对 了 的 精确 分 布 的 理论 上 的 讨论 )， 近 似 的 零 分 布 是 自由 度 为 c-1 的 x 分 布 . 
假设 
Ho: c 个 总 体 有 相同 的 中 位 数 
已 :至 少 有 两 个 总 体 的 中 位 数 不 同 

近似 水 平 为 a HERRE Ty (c-1) 的 区 域 ， 其 中 如 -。(c=-1) 为 一 个 服从 
自由 度 为 c-1 的 x? 分 布 的 随机 变量 的 1 - a 分 位 数 ， 它 可 以 从 表 A2 中 查 到 . 着 
T>. (c-1), WHE H,， 否 则 接受 H,. 

近似 的 p- 值 是 一 个 服从 x 分 布 的 随机 变量 大 于 观测 值 了 的 概率 ， 也 可 以 从 表 A2 
中 查 到 . 

如 果 一 些 样本 容量 n, Aoh, WERDET ERER E AKK a 可 能 与 上 面 
近似 的 a 差异 很 大 )， 上 节 中 给 出 的 法 则 可 以 作为 经 验 法 则 来 用 ， 这 时 ， 若 在 分 析 中 
丢掉 所 有 容量 为 1 的 样本 ， 则 上 述 规则 仍然 适用 . 

多 重 比较 ” 若 零 假设 被 拒绝 ， 可 对 2 x2 列 联 表 重 复 地 使 用 中 位 数 检验 ， 对 总 体 间 进 
行 逐 对 多 重 比较 ， 每 次 比较 可 以 找到 两 个 样本 的 中 位 数 以 及 2 x2 列 联 表 中 大 于 或 小 
于 等 于 那个 中 位 数 的 观测 数 ， 在 2 x2 列 联 表 中 用 (1), (2) 或 (3) 式 计算 检验 统 
HER T, £ T> (1) (自由 度 为 1 的 x 分 布 随机 变量 的 1 - a 分 位 数 ， 可 从 表 A2 


158 第 4 章 列 联 + 


中 获得 ) ， 则 认为 这 两 个 总 体 的 中 位 数 不 相同 . 


计算 机 辅助 ”可 在 Minitab 和 StatXact 中 找到 中 位 数 检验 ， 一 一 一 1 


例 4. 3. 1 


可 用 4 种 不 同 的 方法 来 培植 玉米 ， 在 被 分 割 成 若干 块 的 土地 上 随机 地 采用 这 4 种 方 
法 并 计算 每 块 的 亩 产量 . 


92 91 81 
90 89 
84 


为 了 决定 产量 差异 是 否 由 所 用 种 植 方法 的 不 同 而 引起 的 ， 我 们 采用 中 位 数 检验 ， 因 
为 总 体 中 位 数 的 差异 可 以 解释 为 所 用 种 植 方法 的 差异 值 ， 假 设 表述 如 下 : 

Fo: 所 有 种 植 方法 有 相同 的 亩 产量 中 位 数 

Hi: 至 少 有 两 种 种 植 方 法 的 雷 产量 中 位 数 有 差异 
很 容易 算出 这 里 有 34 个 观测 值 ， 所 以 排序 后 的 第 17 个 和 18 个 观测 值 的 平均 值 ， 即 
89 为 总 中 位 数 . 将 每 种 方法 中 大 于 89 和 小 于 或 等 于 89 的 观测 数 记录 如 下 : 


方法 
1 2 3 4 总 和 


总 和 9 10 7 8 34 
查 表 A2， 得 临界 域 为 了 >Xt oos(c -1) =Xas(3) =7.815 (自由 度 为 c-1=3 的 X 
随机 变量 的 0.95 分 位 数 ， 可 从 表 A2 中 获得 ) 的 区 域 . 用 (1) 式 计算 了 为 : 


N. ogo] [o " Eal 
_ (34? 34 EY S-E 
= 016)(18) 9 人 8 


= 4.01(0.34 + 0.29 + 1.97 + 1.78) = 17.6 (4) 
用 (3) 式 可 简便 地 计算 T， 得 : 
T=š +B ++ =17.6 (S) 


这 与 前 面 所 得 的 值 一 样 . 


43 中 位 数 检验 159 


因为 17.6 的 了 值 大 于 临界 值 7.815 ， 所 以 应 拒绝 H, AR A2 可 知 ，p- 值 稍 小 
于 0.001， 因 为 拒绝 了 4 种 玉米 种 植 方法 有 相同 中 位 数 的 零 假 设 ， 所 以 采用 多 项 逐 
对 比较 是 合理 的 ， 将 方法 1 与 方法 2 比较 ， 我 们 可 以 看 到 ，19 个 观测 的 样本 中 位 数 
为 89， 对 方法 1，9 个 观测 值 中 有 6 个 超过 89; 对 方法 2，10 个 观测 值 中 有 3 个 超 
过 89，2 x2 列 联 表 检验 统计 量 为 2.55， 它 小 于 Xoos (1) =3.841 (自由 度 为 1 Wyr 
随机 变量 的 0.95 分 位 数 ) ， 因 此 ， 方 法 1 和 方法 2 的 中 位 数 不 能 认为 不 同 ， 然 而， 
其 他 逐 对 比较 在 水 平 a =0.05 下 是 显著 的 . 


方法 中 位 数 T 
1 和 2 89 2.55 
1 和 3 92.5 6.35 
1 和 4 83 13.43 
A o 3 91 13.25 
2 和 4 82.5 14.40 
3 # 4 82 15.00 ga 


通过 在 原始 数据 的 子 集 上 重复 地 使 用 相同 的 检验 ， 除 了 第 1 对 比较 外 ， 总 体 的 
多 重 比较 方法 往往 会 牌 曲 其 他 所 有 检验 的 显著 水 平 . 这 种 重复 的 检验 过 程 一 般 作 为 
一 种 个 人 偏好 或 作为 分 离 不 同 总 体 的 一 个 客观 “尺码 ”， 但 是 整个 检验 中 我 们 不 能 给 
出 同 第 1 对 比较 一 样 的 合理 解释 . 关于 重复 检验 过 程 的 进一步 探讨 可 参考 Gabriel 
(1966 ) 或 Knoke(1976). 

例 4.3. 1 中 的 试验 是 按照 一 种 “完全 随机 化 设计 ”来 安排 的 ， 这 种 设计 假设 
不 同 的 方法 是 以 某 种 随机 方式 (或 等 价 于 随机 方式 ) 分 配 到 不 同位 置 上 的 . 通常 
分 析 数 据 的 参数 方法 被 称 为 “ 单 因素 方差 分 析 ”， 关 于 单 因素 方差 分 析 的 中 位 数 检 
AJ A. R. E 依赖 于 总 体 分 布 函数 的 形式 ， 若 总 体 为 正 态 分 布 ， 则 A.R. E 仅 为 
2/x=64% ， 然 而 ， 若 总 体 是 双 指 数 分 布 〈 双 指数 分 布 拥有 重 尾 ) WA. R.E 
为 200% . 

可 将 中 位 数 检验 推广 到 “分 位 数 检 验 ”， 即 零 假 设 为 “ 几 个 总 体 有 相同 的 分 位 
数 "， 对 任何 选 定 的 分 位 数 ， 仅 需 改 动 检验 的 数据 部 分 使 得 观测 值 被 分 为 大 于 或 小 于 
等 于 整个 数据 排列 的 总 分 位 数 . 除了 通 近 式 (3) 不 适用 外 ， 其 余 都 同 中 位 数 检验 一 
样 ， 正 如 下 面 所 给 的 理论 ， 了 的 精确 分 布 (下 面 给 出 它 的 理论 ) 也 与 中 位 数 检 验 时 
有 相同 的 形式 ，Wolfe( 1977a) 给 出 了 两 阶段 样本 的 中 位 数 检验 法 . 
omit 正如 上 节 第 3 种 检验 一 样 ， 因 为 一 系列 法 则 的 目标 是 用 于 决定 观测 的 
计算 是 在 列 联 表 的 上 侧 分 位 或 下 侧 分 位 的 格子 里 ， 所 以 行 总 和 <a,， 是 固定 的 . 
例如 ， 如 果 检 验 是 一 个 “上 侧 四 分 位 数 ” 检 验 ， 则 a KAK NA, b 大 约 为 
3NM4 ,“ 大 约 ” 而 不 是 “等 于 ”是 由 于 “允许 样本 中 有 结 点 或 样本 值 相 等 ” 引 
起 的 ， 因 此 ,7 的 精确 分 布 是 依赖 于 行列 总 和 的 条 件 分 布 ， 得 到 下 列表 (固定 
列 总 和 ) 


222 
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aJa a] ， 
On | On| | œj è i 
a 
的 概率 是 二 项 分 布 的 乘积 | | 
P 区 = [o.) pOui(1 — p)O2;; a, MET. 7 


这 里 p 是 一 个 观测 大 于 总 中 位 数 的 概率 ， 现 在 H, 仅 是 表述 “所 有 总 体 都 拥有 相同 的 
中 位 数 ”， 这 并 不 意味 着 “所 有 总 体 都 有 相同 的 p (超过 样本 总 中 位 数 的 概率 )". 2 
一 方面 ， 尽 管 这 两 种 阐述 ( H, 和 前 面 的 情形 ) 在 含义 上 很 相似 , 但 是 从 H, 不 能 推 
断 出 后 一 论断 ， 当 H, 为 真 时 ， 为 了 找到 了 的 精确 分 布 ， 我 们 必须 要 求 对 所 有 总 体 ， 
超过 总 中 位 数 的 概率 p 相同 ， 这 就 是 为 什么 我 们 要 给 模型 加 第 4 个 假设 的 原因 . 
因为 样本 彼此 相互 独立 ， 用 (7) 式 相 乘 ， 我 们 可 以 得 出 表 (6) 的 联合 概率 


分 布 
P On| On|- | Ore se arep ass (8) 
Oo +- |[Oz]] Von Oz Or 

这 里 

a = On + On 十 … + Ok 
和 

b = On + On +> : :+ Ox 
给 定 了 行 总 和 a，b， 正 如 前 一 节 的 后 面部 分 一 样 ， 用 (8) 式 所 得 到 的 概率 除 以 得 到 
的 行 总 和 a, “的 概率 ， 则 得 (8) 式 中 事件 的 概率 ， 其 结果 是 : 


GET 1. lo. (o) ` (o. p 
On| Oa- $ + 
M nN n N (x) 


与 4.2 节 中 (14) 式 相 一 致 ， 我 们 不 加 推导 地 将 (9) 式 按照 多 项 系数 记 为 如 下 
形式 : 

a b 

[5 = (10) 


因此 ,了 的 精确 分 布 可 以 用 (9) 或 (10) RRE, (BRA E, FEIE 
(因为 行 数 为 2) ， 我 们 常用 自由 度 为 c -1 的 x 分 布 来 代替 . “= 
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> 中 位 数 检 验 的 推广 
可 将 前 面 的 中 位 数 检 验 进 行 推广 ， 使 之 能 分 析 更 复杂 的 试验 ， 因 为 在 中 位 数 检验 
的 推广 中 使 用 的 记号 很 烦琐 ， 我 们 通过 一 个 应 用 例子 来 介绍 这 种 检验 .一 a 
例 4.3.2 
在 6 块 不 同 的 地 里 使 用 4 种 不 同 的 肥料 ， 并 且 整 个 试验 重复 使 用 3 种 不 同 的 种 子 ， 在 
试验 的 (4) (6) G) =72 个 不 同 的 条 件 下 ， 得 到 试验 的 亩 产 结果 如 下 : 
种 子 1 种 子 2 种 子 3 


试验 田 805 901 87.0 88.0 791 870 826 85 854 923 920 893 


1 

2 870 834 891 903 776 820 814 879 892 90.1 90.2 93.6 
3 86.1 824 910 861 841 806 890 804 900 881 872 90.8 
4 821 849 844 83.1 833 795 863 83.1 834 38.3 94.3 876 
5 793 871 922 9018 76.6 86.2 840 874 841 863 884 93.7 
6 842 893 853 847 810 841 881 850 823 929 95.1 829 


为 了 检验 零 假设 

Ho: 肥 料 不 辣 不 会 引起 产量 中 位 数 的 差异 
记 第 i, 块 地 上 用 肥料 ii 和 种 子 i 观测 到 的 产量 为 x,,,， 例如 ，xzis 表 示 第 1 块 地 上 使 
用 肥料 2 和 种 子 3 后 观测 到 的 产量 ， 从 上 表 中 可 查 到 为 92. 3， 然 后 将 xy EJ XXn, 
3X 的 中 位 数 相 比较 ， 后面 的 4 个 数 代 表 了 在 其 他 因素 等 同 的 条 件 下 ， 施 不 同 的 
肥料 得 到 的 产量 (H, 说 明 施 肥 差 异 对 产量 没有 影响 )， 因 此 ，xws 是 同 85. 4,92. 3， 
92.0 和 89. 3 的 中 位 数 

()(89.3 + 92.0) = 90.65 

进行 比较 ， 如 果 x,,; 大 于 90. 65， 在 表 中 由 1 代替 ， 和 否则 由 0 代替 . 

类 似 地 ， 每 一 所 与 2 ,i ，…,X6 的 中 位 数 相 比 较 ， 这 些 数 代 表 了 除了 施肥 
的 差异 外 ， 其 他 因素 等 同 的 条 件 下 得 到 的 产量 . 在 本 例 中 ， 每 个 产量 将 与 同一 行 
(土地 ) 同一 块 (种 子 ) 的 中 位 数 相 比 较 ， 然 后 根据 它们 是 否 超过 各 自 的 中 位 数 分 
别 记 为 1 或 0. 结果 如 下 : 


种 子 1 种 子 2 种 子 3 
肥料 

1 2 3 4 1 J 3 £ i > S á 

试验 田 1 | 0 1 0 1 1 O. Ù- -1 1 0 
° 0 `Ü i i 0 íi 0 bp 0 Db T1 

% E T ED i 4 TT Gb. 1i lD g 3 

£ S O QO f O 3 CQ O Q 3° | 

5 0 0 1 1 0 1 0 1 0 0 1 1 

6 0 1 J ťi w g. Tt r o 34 k: g 
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记 O, 为 使 用 肥料 j 且 得 到 的 产量 超过 各 自 中 位 数 的 土地 块 数 ， 即 为 上 表 在 施肥 料 j 
条 件 下 得 到 “1” 的 总 数 ， 下 表 给 出 所 有 的 O, =1,2,…,c. 
肥 料 


O, =“1” 的 数目 


n, = 18 m = I8 n = I8 n, = I8 N = 72 


则 可 将 通常 的 中 位 数 检验 用 于 此 表 . 由 (3) 式 ， 我 们 得 到 : 
p= (144 + 4 + 100 + 4) 
18 


= 14.0 (11) 

将 了 与 好 (3) (自由 度 为 c-1=3 的 x 随机 变量 的 0.95 分 位 数 ) 相 比较 ， 查 表 
A2 (B 2 (3) =7.815， 由 于 T>7.815， 所 以 应 拒绝 H,， 相 应 的 p- 值 大 约 为 0. 004. 
E] 


习题 


I. 


[226] 5. 


检验 零 假 设 : 以 下 样本 来 自 于 中 位 数 相 同 的 总 体 
样本 1: 35, 42, 42, 30, 15, 31, 29, 29, 17, 21 
样本 2: 34, 38, 26, 17, 42, 28, 35, 33, 16, 40 
样本 3: 17, 29, 30, 36, 41, 30, 31, 23, 38, 30 
样本 4: 39, 34, 22, 27, 42, 33, 24, 36, 29, 25 | 
将 一 些 油井 拍卖 给 出 价 最 高 的 投标 人 ， 每 个 油井 都 收 到 至 少 一 个 密封 投标 检验 零 假 设 : 
已 经 投入 生产 的 油井 与 还 未 投入 生产 的 新 井 有 相同 的 中 位 投标 数 . 从 两 种 类 型 的 油井 中 
各 抽取 一 个 随机 样本 ， 结 果 如 下 : 
每 个 油井 的 投标 数 
投入 生产 的 6, 3, 1, 14, 8 9, 12, 1, 3, 2, 1, 7 
KRHA 6,2,1,1, 3,1,2, 4, 8, 1, 2 
例 4. 3. 2 中 的 试验 结果 是 否 说 明 种 子 差异 显著 ? 
例 4. 3. 2 中 的 试验 结果 是 否 说 明 土 地 差异 显著 ? 
30 种 股票 的 随机 样本 分 别 选 自 美国 三 大 股票 交易 市 场 ， 并 记录 下 它们 上 一 年 的 运作 情况 . 
整理 所 有 90 种 股票 的 中 位 数 运作 记录 ， 并 列表 如 下 : 


超过 中 位 数 
交易 市 场 — 的 股票 数 
纽约 18 
美国 17 
纳 斯 达 克 10 


上 一 年 三 个 交易 市 场 的 股票 运作 是 否 有 显著 差异 ? 


= Ts. 
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6. ”随机 地 将 100 名 入 伍 新 兵 分 配给 海军 训练 新 兵营 的 4 位 军士 来 训练 ， 训 练 将 结束 时 ，84 
名 新 兵 留 了 下 来 ， 并 且 记 录 了 他 们 障碍 课程 的 成 绩 . 


军士 训练 新 兵 数 成 绩 超过 中 位 数 的 士兵 人 数 
Adams 20 11 
Baker 22 8 
Callahan 20 8 
Davis 22 15 
4 位 军士 的 训练 结果 是 否 有 显著 差异 ? 


思考 题 


l. 若 a=b, 证 明 (1) 式 可 变 成 (3) sÇ. 

2. 车 r=2, WH (1) R5 (4.2.11) 式 相同 . 

3. 本 节 中 设计 的 常用 参数 检验 〈 单 因素 情形 ) 通常 假设 每 个 观测 服从 正 态 分 布 ， 而 不 是 仅 
仅 依赖 低 于 或 高 于 中 位 数 所 得 到 的 0 或 1 车 每 个 样本 中 的 观测 当 它 们 低 于 总 中 位 数 时 称 
为 0 集 ， 大 于 或 等 于 总 中 位 数 时 称 为 1 集 ， 通 过 计算 0 集 和 1 集 上 的 个 数 ， 前 面 参数 检验 
的 统计 量 可 简化 为 : 


证 明正 可 以 写成 如 下 了 的 郴 数 
= T(N-o _ 

(N — T)(c ~ 1) 
因此 ， 当 了 值 较 大 时 拒绝 H, 与 当下 值 较 大 时 拒绝 H, 等 价 . 


4.4 相依 性 度量 


列 联 表 可 以 方便 地 检验 数据 是 否 具 有 某 种 内 在 的 相依 性 ， 通过 列 联 表 ， 可 以 
揭示 一 种 特殊 类 型 的 相依 : 行 一 列 相依 . 若 不 同 的 行 代表 从 不 同 总 体 中 抽取 的 样 
本 ， 不 同 的 列 代表 同一 样本 中 数据 不 同 的 分 类 ， 则 一 个 行 一 列 相依 与 所 抽取 样本 
的 总 体 上 不 同类 中 的 概率 函数 相依 同 义 ， 类 似 地 ， 如 果 某 个 随机 样本 中 的 观测 根 
据 两 个 不 同 准则 被 归 人 行 与 列 中 ， 显 然 一 个 行 一 列 相依 可 解释 为 分 类 两 个 准则 间 
的 一 种 关系 . 

正如 本 章 中 到 目前 为 止 我 们 所 做 的 ， 代 替 检 验 假 设 ， 我 们 仅 希望 表达 一 个 给 定 
列 联 表 所 示 的 相依 度 ， 当然 ， 我 们 更 愿意 以 一 种 简单 的 形式 ， 以 及 把 由 列 联 表 表 现 
出 的 精确 相依 度 易于 传授 给 他 人 的 形式 来 表示 相依 度 . 

与 第 1 种 方法 一 样 ， 我 们 可 用 上 节 的 检验 统计 量 


F 
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r c E. 32 

r= y> > C (1) 
i=1 j=1 ij 

作为 相依 性 的 度量 ， 一 般 来 说 ,“ 如 果 它 对 相依 性 检验 足够 好 ， 那 么 对 相依 性 的 度 

量 也 就 足够 好 . ”T 的 使 用 似乎 满足 我 们 所 考虑 的 方便 和 简捷 ， 然 而 ， 为 了 将 相依 

度 传授 给 其 他 人 ， 应 标明 并 的 自由 度 ， 这 是 因为 没有 自由 度 就 不 可 能 告诉 别人 7 值 

所 揭示 的 相依 度 ， 即 使 知道 自由 度 ， 为 了 解释 T， 非 专业 人 士 也 必须 借助 于 一 张 


X 表 . 
例 4.4.1 
例 4. 2. 1 中 的 列 联 表 如 下 : 
分 数 
0-275 276-350 351-425 426-500 总 和 


计算 本 列 联 表 的 了 为 17.3， 现 在 17.3 近似 为 Mew(3) ， 所 以 
p- 值 = 1 一 p= 0.001 
如 此 小 的 P- 值 说 明 数据 强烈 不 “同意 ” 行 分 类 (学 校 类 型 ) 与 列 分 类 (测验 分 数 ) 
独立 的 零 假设 , 但 是 它 并 不 能 度量 相关 水 平 . Rs 
= Cramér 关联 系数 


一 种 易于 解释 的 相依 性 度量 方法 就 是 包括 修改 (1) 式 中 的 T， 使 得 结果 不 像 了 
一 样 太 多 地 依赖 于 自由 度 ， 一 种 修改 是 用 了 除 以 达到 可 能 的 最 大 7T 值 ， 目 前 我 们 知 
道 大 值 来 自 格子 计数 显著 不 平衡 的 列 联 表 ， 通 过 检测 极端 不 平衡 的 列 联 表 (假设 
样本 容量 为 N， 给 定 r 行 c 列 ), 我 们 由 基本 试验 和 误差 发 现 ， 当 每 行 每 列 中 除了 一 
个 格子 里 的 数 外 其 余 全 为 0 (WE rác, HIRIEK) 时 了 最 大 ， 即 有 了 在 下 
列 列 联 表 中 达到 最 大 值 
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在 定义 0/0 =0 或 等 价 地 忽略 行 或 列 全 为 0 的 格子 后 ， 此 表 中 T=18. 

一 般 情况 下 ,的 最 大 值 为 N(g -1) ， 这 里 q 为 r,c 中 较 小 的 一 个 ，N 为 观测 总 
数 ， 工 除 以 最 大 数 后 为 ; 

T 
-NG -7 @ 
其 中 了 为 r,c 中 较 小 者 ， 若 列 联 表 中 指明 一 个 强行 一 列 相依 性 时 ， 则 R, 接近 于 1.0， 车 
列 联 表 中 每 行 中 的 列 数 相互 有 相同 的 比例 ， 且 这 个 比例 与 列 总 和 间 的 相互 比例 相同 ， 
则 R, 接近 于 0， 这 种 度量 是 由 Cramér( 1946,p.443) 提 出 的 ，R, 的 方 根 即 为 “Cramer 系 
数 "， 很 多 现代 的 计算 包 ， 比 如 SAS 和 StarXact 都 可 以 计算 . 


Cramer 系 数 = mi (3) 


Ri 


这 也 是 目前 度量 rx c 列 联 表 相依 性 最 广泛 使 用 的 方法 .一 一 一 一 一 一 一 一 一 4 
例 4. 4. 2 
在 上 例 2 x4 列 联 表 中 ，T=17.3， 因 为 N=128 和 gq =2， 我 们 由 (2) 式 ， 得 到 
3 
R. “NQ UD 18 = 0.135 
和 Cramér 系数 为 /0. 135 = 0. 368. 加 


像 所 有 好 的 相依 性 度量 一 样 Cramér 系数 是 “尺度 不 变 ” 的 ， 即 如 果 试 验 数值 
的 尺度 变 大 ， 比 如 例 4. 4. 1 中 将 学 生 人 数 扩 大 10 倍 ， 只 要 所 有 观测 值 变 化 一 致 ， 则 
相依 性 的 度量 不 会 改变 。 如果 10 倍 多 的 学 生 参 与 测试 ， 则 每 格 中 的 观测 结果 也 扩大 
10 倍 ， 相 应 的 列 联 表 结 果 如 下 : 


分 数 
0-275 276-350 351-425 426-500 总 和 
私立 学 校 460 
公立 学 校 820 
总 和 360 460 340 120 1280 


检验 统计 量 也 扩大 了 10 8, X173, (B Cramér 系数 仍 为 0.368， 这 是 因为 对 较 小 
尺度 试验 的 相依 度 同 较 大 尺度 试验 的 相依 度 相同 . 


p Pearson 关联 系数 


KÈ Cramer 系数 外 ， 另 外 两 种 关联 系数 有 时 也 用 到 . 第 一 种 是 均 方 关联 Pearson 
系数 (Pearson's coefficient of mean square contingency), €H Yule 和 Kendall( 1950, 


p. 53 ) 给 出 ， 定 义 为 : 


229 
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N +T (0 


我 们 已 说 明了 的 最 大 值 为 N(q -1)， 所 以 R, 的 最 大 值 为 : 
Raman = /rr (5) 
在 很 多 情形 下 ， 它 接近 于 1 ,7 的 最 小 值 可 能 为 0， 所 以 


0< R; <,3 <10 (6) 


McNemar( 1962 , p. 198 ) #ll Siegel ( 1956 ,p. 196) 也 称 R, 为 关联 系数 ( contingency coef- 
4 


ficient). 
例 4. 4.3 
在 前 面 两 例 的 列 联 表 中 ,我 们 有 T=17.3 和 N=128， 所 以 


| j HR 19... 
R= (N+T™ VIB +173 ` 0295 页 
> Pearson 均 方 关联 系数 


我 们 给 出 第 3 种 相依 性 度量 R, CRH Pearson 关联 系数 的 特点 ( 见 Cramér, 
1946 ,p.282) ， 也 被 Yule 和 Kendall ( 1950 , p. 53 ) 称 为 Pearson 均 方 关联 系数 〈《mean- 
square contingency coefficient). R, 的 定义 如 下 : 


R3 =£ (7) 
由 上 述 讨论 ， 我 们 得 到 : 
0 和 Ra<4-1 
为 了 正确 解释 由 R 得 到 的 相依 度 ， 我 们 需要 知道 r, c 的 知识 . ———: 
例 4. 4. 4 
用 前 例 中 的 列 联 表 ， 我 们 得 到 
RL = =a = 0.135 m 


最 后 ， 我 们 简单 提 一 下 TschuProw 系数 (Tschuprow's coefficient), €H Yule 和 
Kendall( 1950) 提出 ， 形 式 如 


_ = 
(r — 1)(c — 1) @ 


相依 性 度量 方法 的 选择 很 大 程度 上 取决 于 个 人 决定 ， 最 初 的 动机 来 自 于 传统 习 
惯 ， 而 不 是 统计 上 的 考虑 .进一步 的 讨论 见 Stuart( 1953). 
对 于 2 x2 列 联 表 ， 
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si PT ， 
5 EE] = 


Ci C7 N 
前 面 的 度量 可 以 简化 一 些 ， 从 习题 4.2.2， 我 们 知道 了 可 写成 : 
_ N(ad — bc)° 
r rir2C1C2 (9) 
因此 R,， R, (因为 g =2) 简化 为 
T (ad— bc) 
Ri =R. = 六 = (10) 
并 有 日 Cramér 系数 变 为 
T _ lad- bc) 
VR N(q—1) V rir2cic2 n 
R, 可 写 为 


AT P. (ab ~ bc) 
Pra N +T rir2C1C2 + (ab 一 bc) (12) 


PRF rx c 列 联 表 ， 在 一 个 2 x2 列 联 表 中 ， 有 时 区 分 正 关联 和 和 负 关 联 是 有 意义 
的 ， 比 如 当 分 类 的 两 个 标准 有 对 应 的 类 型 时 . 
例 4. 4.5 
根据 母亲 的 头发 和 父亲 的 头发 是 否 为 黑色 或 金色 将 40 个 孩子 分 类 ， 根据 ad - bc 是 
正 或 负 ， 则 结果 可 能 表现 出 正 关联 ( 正 相关 ) 
父亲 
黑色 ”金色 


或 负 关 联 (MHAR) 


N 


无 关联 ( 零 相关 ) 的 情形 可 表示 如 下 : 
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p Phi 系数 


如 果 要 找到 关联 的 类 型 ( 正 ， 负 或 零 相 关 ) ， 必 须 注 意 建立 列 联 表 使 得 a。 和 4 能 
代表 相似 分 类 (黑色 一 黑色 ， 金 色 一 金色 ) g, 而 b 和 c 能 代表 相 异 分 类 (黑色 一 
金色 ， 金色 一 黑色 ) 数 ， 一 种 保留 方向 关联 类 型 的 度量 是 Phi 系数 (phi coefficient), 
由 下 式 给 出 : 

ad — bc 
a V f1r2C1C2 “9 

它 的 范围 为 -1 到 +1， 其 中 -1 表示 所 有 对 象 都 被 归 人 到 “ 相 异 ”类 中 (ae=d=0)， 而 
1 表示 所 有 对 象 都 被 归 人 到 “相似 ”类 中 (bp =c=0)， 其 实 Phi 系数 只 不 过 是 保留 了 符 
号 ( 即 ad -bc 的 符号 ) 的 Cramkr 系数 (L (11) =). Phi 系数 方法 被 广泛 采用 的 一 
个 原因 是 ， 它 是 Pearson 乘积 矩 相 关系 数 ( 见 下 章 ) 的 特殊 情形 ， 它 是 用 数 来 代表 类 进 
行 计算 的 . 注意 ,在 2 x2 列 联 表 分 析 中 使 用 的 检验 统计 量 T 与 Phi 系数 间 有 着 紧密 关 
系 ，(4.1.1) 式 表 明 Phi 系数 等 于 T /VAN 一 一 1 
例 4.4.6 
对 例 4. 4. 5 中 的 第 1 个 表 ， 我 们 有 

a=28 n=28 b = 

c = 5 c, = 33 d = 7 C2 = 
所 以 ，R, 可 如 下 计算 : 


Rea ad 一 bc _ _ (2807) -0 _ 0.703 (14) 
Vrlfzclcz V (28)(12)(33)(7) 


对 例 4.4.5 中 的 第 2 个 表 ， 计 算 R, 为 


0-002 __ dbj 
R; = = 3 
s= /Q802037) O 
它 反映 了 头发 类 型 的 负 关联 . " 
其 他 2 x2 列 联 表 的 关联 性 度量 方法 还 包括 由 Yule 和 Kendall (1950 ,p. 30) 提出 的 
Re = ad — bc (16) 
ad + bc 


$ Ives 和 Gibbons (1967) 提出 的 


p 8829 0 E (17) 


a+b+c+d 
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可 定义 的 关联 度量 方法 有 许 许多 多 ， 选 择 何 种 系数 取决 于 个 人 偏好 . 

有 时 我 们 面临 这 样 的 问题 :“ 我 们 如 何 用 R (或 R,,R, 等 ) 作为 检验 统计 量 来 
检验 具有 独立 性 的 零 假 设 . ”答案 是 : 用 求 4.2 节 中 了 的 精确 分 布 同样 的 步骤 ， 你 可 
以 找到 任意 一 个 度量 的 精确 小 样本 分 布 ， 因 此 理论 上 总 可 以 设计 一 个 检验 ,但 事实 
上 对 同样 假设 检验 ， 它 比 4. 1 节 和 4.2 节 来 得 更 容易 且 更 有 效 . 

特别 地 ， 系 数 


DE Sis: OER 
= NV(r — 1)(c — 1) 


同 Cramér 系数 一 样 ， 当 T“ 太 大 ”时 ,它们 也 会 “ 太 大 ” ,原因 是 它们 随 着 了 的 增 减 而 
增 减 ， 在 4.2 节 的 检验 中 ， 我 们 用 了 作为 检验 统计 量 ， 当 了 显著 时 ， 可 以 推出 R 显著 
基于 Phi 系数 R, 的 单 边 检验 对 2 x2 列 联 表 情形 是 合适 的 ， 原 因 是 它们 有 如 下 关系 : 
iy 


Rs = (18) 


这 里 的 Ti 由 (4.1.1) 式 所 给 出 , H T, 是 渐 近 正 态 的 ， 因 此 VN . R, 也 是 渐 近 正 态 的 . 
所 以 若 VN . R, KK (对 于 水 平 w， 即 VN R, 超过 了 zx, -。) ， 就 应 拒绝 零 假 设 
Ho: 不 存在 正 相关 
并 且 若 VN : R, 太 小 (对 于 水 平 ag， 即 VN: Rs 小 于 zx.) ， 就 应 拒绝 零 假 设 
Ho: 不 存在 负 相 关 
这 与 4. 1 节 中 所 描述 的 基于 T, 的 检验 完全 相同 . 
例 4. 4. 7 
为 了 检验 安全 带 能 否 防 止 死亡 事故 ,我 们 提取 了 发 生 在 高 速 公 路 上 的 100 起 车 祸 的 
记录 做 研究 ， 这 100 起 事故 涉及 到 242 个 人 ， 每 个 人 根据 事故 发 生 时 是 否 系 安全 带 
和 是 否 带 来 致命 伤害 来 分 类 ， 结果 如 下 : 


致命 伤害 ? 
是 否 总 和 
azas 是 | 7 | 的 | % 
否 | 2 |R| 1% 
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我 们 希望 证 明 的 是 :“ 安 全 带 可 以 防止 死亡 事故 的 发 生 . ”然而 ， 一 个 相关 检验 不 能 
自动 地 给 出 因果 关系 ， 而 两 个 变量 间 的 因果 关系 往往 导致 相关 ， 一 个 显著 相关 又 有 
可 能 是 这 两 个 变量 都 会 被 第 三 个 变量 影响 ， 如 本 例 ， 两 个 变量 都 可 以 受到 司机 的 粗 
心 大 意 这 个 变量 的 影响 .因此 零 假 设 是 
Ho: 在 一 次 交通 事故 中 ， 系 安全 带 与 死亡 事故 不 存在 负 关 联 备 择 假 设 为 
i: 在 一 次 交通 事故 中 ， 系 安全 带 与 死亡 事故 存在 负 关 联 
本 例 与 我 们 曾 描 述 的 两 准则 分 类 没有 相同 对 应 类 的 情形 有 少许 不 同 (“是 ”和 
“ 否 ”意味 着 在 行 中 是 一 类 ， 在 列 中 又 是 另 一 类 ) ， 因 此 我 们 需要 考虑 所 面临 的 是 哪 
一 种 情形 .本 例 中 , # H. 为 真 ， 则 我 们 期 望 b 和 c 大 于 a 和 d， 因 此 不 等 式 
ad — bc < 0 
ATEH, AMSER 为 负 ， 所 以 若 VN . R, 小 于 -1.645 (标准 正 态 分 布 的 
0.05 分 位 数 ， 由 表 Al 获得 ) ， 则 拒绝 有 ， 本 例 中 的 检验 统计 量 : 
VN(ad ~ bc) 
VN: Res V Y1r2C1C2 
_ V242[(7)(122) — (89)(24)] _ _ , 0829 
V (96)(146)(31)(211) 

小 于 -1.645， 所 以 应 拒绝 H. In 148 H (š Fk 2 8 pik p pk TU 3 bk EAKR 
的 〈 这 种 关系 是 否 为 因果 关系 仍 是 一 个 公开 的 问题 )， 同 时 可 从 表 Al 中 查 到 p- 值 约 
为 0. 019. = 

其 他 几 种 基于 两 准则 分 类 得 到 变量 间 的 相依 性 度量 方法 可 参考 Goodman 和 
Kruskal( 1954 ,1959 ,1963 ) 的 经 典 文章 .Davis (1967) 介绍 了 偏 系 数 方法 . 


习题 


L 调查 100 对 已 婚 夫妇 ， 分 别 询问 丈夫 和 妻子 希望 谁 是 下 一 届 美 国 总 统 的 首选 ， 结 果 如 下 : 


妻子 的 选择 
A B 其 他 
丈夫 的 选择 E wa 
其 了 |3|7| 9 
计算 : 
(a) 了 (b) Cramer 系数 (c) R, 
(d) R, (e) R, (f) R, 


2. 一 名 护士 让 50 位 遭受 关节 炎 折 磨 的 工人 服 下 两 种 不 同 的 药物 ， 其 中 25 人 服 下 阿司匹林 ， 
另外 25 人 在 不 知情 的 情况 下 服 下 安慰 剂 . 一 个 小 时 后 ， 询 问 工 人 药物 是 否 让 他 们 感觉 好 
些 ， 服 阿司匹林 组 有 17 人 和 服 安奈 剂 组 有 12 人 给 出 肯定 回答 . 
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(a) 使 用 R, 来 检验 服用 阿司匹林 与 “感觉 好 些 ” 间 是 否 存在 正 相关 . 
(b) HER. — (c) HER, 
对 一 个 交通 状况 良好 的 城市 街道 进行 短期 的 交通 状况 调查 ， 共 调查 了 64 辆 小 轿车 ， 其 中 
16 辆 超速 ， 而 48 辆 没有 ， 并 且 24 辆 带 有 乘客 而 其 余 车 上 只 有 司机 一 人 ，12 个 超速 者 独 
自驾 车 ， 假 设 观 测 的 交通 状况 是 整个 交通 状况 的 一 个 随机 样本 ， 则 
(a) 使 用 R; 来 检验 超速 与 独自 驾车 二 者 之 间 是 否 存 在 正 相关 . 
(b) 计算 Re. (c) HH R. | 
在 美国 西南 部 的 湖 中 发 现 了 某 种 昆虫 ， 对 这 种 昆虫 的 一 项 研究 就 是 为 了 找 出 这 种 昆虫 的 
染色 体 结构 是 否 会 因为 所 在 州 的 不 同 而 有 显著 差异 .不 同 染 色 体 类 型 的 昆虫 数 记录 
如 下 : 

类 型 ”得克萨斯 ”新 墨西哥 THAM MHARE 


A 54 72 83 96 
B 20 6 18 6 
C 17 8 12 0 
D 0 12 14 1 
E 0 10 0 0 
计算 : 
(a) T (b) Cramér 系数 (c) R, 
(d) R, (e) R, (f) R, 238 
思考 题 


l. 


2. 


4. 


在 下 面 的 列 联 表 中 ， 试 证 明 : T=N(q-1) (这 里 +<c). 


对 于 习题 1， 考 虑 另外 一 个 rxec 列 联 表 ， 使 你 怀疑 有 较 大 的 值 ， 并 计算 你 构造 的 列 联 
表 的 T 值 ， 它 是 否 大 于 N(g -1)? 
证 明 如 下 等 式 : 


2 一 
(a) R; LER 


R? 


(b) R. =; = 
2 
(c) r = 2 Ac = 2 时 ,R, = Rš = R. 
证 明 Phi 系数 是 数 对 (X,Y;) 上 的 Pearson 乘积 和 矩 相关 系数 : 
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PN ET -A 
[È e - Xy Z -F| 


i=] j=1 


HH, (X,Y) 根据 观测 所 在 格 分 别 取 值 (0,0)，(0,1) (1,0) 或 (1,1), 根据 上 面 的 
公式 计算 相关 系数 ， 然 后 说 明 0 和 1 两 个 数 可 由 任意 两 个 数 p 和 9 代替， 其 结果 也 成 立 . 
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人 们 通常 关心 被 观测 随机 变量 的 未 知 概率 分 布 的 假设 检验 问题 ， 例 如 : “中 位 数 
为 4.0” 和 “两 个 总 体 在 类 1 中 的 概率 一 样 "， 我 们 遇 到 更 加 详尽 的 假设 包括 : “未 
知 分 布 函数 是 均值 为 3.0， 方 差 为 1.0 的 正 态 分 布 函 数 ” 或 “随机 变量 服从 参数 为 m 
=10 和 p=2 的 二 项 分 布 "， 后 面 这 两 个 假设 更 加 详尽 是 因为 这 些 假 设 不 仅仅 是 关于 
概率 某 些 方面 的 陈述 ， 比 如 中 位 数 ， 而 是 关于 整个 概率 分 布 的 陈述 ， 因 此 也 就 包括 
了 所 有 概率 和 分 位 数 的 陈述 ， 后 两 种 类 型 的 假设 可 以 用 “ 拟 合 优 度 检验 ”来 检验 ， 
即 设计 一 个 检验 来 比较 从 假设 的 分 布 中 抽取 的 样本 ,看 所 假设 的 分 布 晴 数 与 样本 数 
据 是 否 “ 拟 合 ”. 
最 悠久 和 众所周知 的 拟 合 优 度 检验 是 x 拟 合 优 度 检 验 ， 它 由 Pearson(1900 ) 首次 
提出 . 


> x 拟 合 优 度 检 验 


数据 ”数据 由 随机 变量 X 的 入 个 观测 组 成 ,这 WN 个 观测 划分 为 c 类 ， 并 且 在 每 类 中 
的 观测 数 可 归 和 人 到 如 下 1 x c 列 联 表 中 . 
Pa 
1 2 a c 总 和 


== [ToT ° 


记 类 O, 3928 j 中 的 观测 数 ， j=1 y | """ C. 


假定 条 件 
1. 样本 是 随机 的 . 
2. 度量 尺度 至 少 为 名 义 的 . 
检验 统计 量 
在 零 假设 H, 为 真 的 条 件 下 ， 令 的 一 个 随机 观测 落 人 类 j 的 概率 为 pr. ES E ,为 
E; = pi N, j=1,2,...,c (1) 


这 里 E, 表示 H, 为 真 时 ， 观 测 落 入 类 jj 的 期 望 观测 数 ， 给 出 如 下 检验 统计 量 T: 
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°. (O; — Ej}? 
ma E i ik 
一 个 计算 方便 而 等 价 的 表达 式 为 
c O 
T=%—- N (3) 
> 


零 分 布 的 精确 分 布 难以 求 得 ， 所 以 我 们 用 自由 度 为 c -1 的 x 分 布 来 近似 . 
假设 
Ho: P(X 在 类 j 中 ) =p; ,j=1,2,,c 
Hi: P(X 在 类 j 中 ) zp; ,对 某 个 j 

# T> - (c-1) (自由 度 为 c-1 的 x 分 布 的 1 -a 分 位 数 ， 由 表 A2 获得 ) ， 
则 拒绝 及 ,，p- 值 近似 等 于 P(x (c -1) >T)， 这 个 概率 可 由 表 A2 获得 . 
计算 机 辅助 ”可 在 Minitab ,S-plus 和 StatXact 中 运行 xX 拟 合 优 度 检验 ， 一 一 一 一 所 
评注 

如 果 一 些 E Kh, Hy 分 布 渐 近 (在 下 面 描述 ) 可 能 不 合适 , 但 究竟 小 到 什么 程 
度 可 能 还 不 清楚 . 但 是 ，Cochran( 1952) 建议 所 有 E, 都 不 能 小 于 1 BATRE 20% Hy E, 
小 于 5， 最 近 的 研究 结果 表明 这 个 限制 还 可 以 再 放宽 一 些 ，Yamold(1970) 提 到 ; “如 果 
类 的 数目 s 为 3 个 或 3 个 以 上 ,r 为 类 中 期 望 观 测 数 小 于 5 的 数目 ， 则 最 小 的 期 望 观 测 
数 可 以 小 到 5r/s. ”Slakter(1973) 认 为 类 的 数目 可 以 超过 观测 数 ， 这 意味 着 平均 期 望 值 
可 以 小 于 1. 更 近 一 些 的 研究 成 果 是 由 Koehler 和 Larntz( 1980) 发 现 的 ， 他 们 指出 ， 只 
要 N2:10,c>3,N /c>10 并 且 所 有 E, >0.25, My 分 布 来 近似 都 是 合适 的 .如 果 有 很 
£ E, 偏 小 ， 使 用 者 可 以 基于 Koehler 和 Carrotz 的 研究 考虑 合并 一 些 格子 . 
例 4.5.1 
用 某 种 计算 机 程序 来 产生 随机 个 位 数 ， 如 果 程 序 运 行 正 常 ， 则 计算 机 将 输出 数字 
(2,3,7,4 等 ) ， 这 些 数字 可 看 作 独 立 同 分 布 随 机 变量 的 观测 ， 这 里 每 个 数字 0 ,1 ,2， 
…,8,9 是 等 可 能 得 到 的 〈 概 率 为 0. 1) ， 我 们 要 检验 

Ho: 数 字 是 随机 出 现 的 
对 备 择 假设 : 
HHi: 某 些 数 字 较 其 他 数字 更 可 能 出 现 

则 一 种 方法 就 是 计算 每 个 数字 出 现 的 次 数 ， 以 下 是 产生 的 300 个 数字 . 


1578748416 4705188926 6936349612 
4653843213 0282868892 3928057043 
5101259393 9837006785 3011679938 
7122863085 6528271107 2956427027 
2671728075 9759178719 9373309535 
8363265100 2546793732 2212122529 
9453087720 3976759377 9593511031 
5605373242 1819898287 3872181027 
3494768396 9296177240 8620774591 
4659773922 9246724287 8326143939 


[242] 
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在 零 假设 下 ， 每 个 数字 是 等 可 能 出 现 的 ， 所 以 0,1,2,…,9 中 每 个 数字 出 现 的 期 望 次 
数 应 为 30， 但 是 数字 2 出 现 了 41 次 而 数字 4 仅 出 现 了 19 次 ， 这 是 不 是 由 随机 波动 
引起 的 呢 ? 


完整 的 观测 计数 如 下 ; 
数字 0 1 2 9 4 5 6 7 8 9 总 和 
观测 频数 2 28 4 35 19 25 235 4 30 35 300 
期 望 频数 30 30 30 30 30 30 3 30 30 3 300 
检验 统计 量 为 : 
10 Oš 
T= 2 E. N =317-300=17 (4) 


因为 T>xaw(9) =16.92 (自由 度 为 9 的 x 分 布 的 0. 95 分 位 数 ， 由 表 A2 获得 ) ， 因 
此 在 置信 性 水 平 0.05 下 拒绝 零 假 设 ， 即 更 倾向 于 备 择 假设 ,说 明 数 字 不 是 等 可 能 由 
计算 机 程序 产生 的 . 查 表 可 知 ，p- 值 略 小 于 0. 05. gi 
评注 

如 果 X 的 概率 分 布 除了 大 个 参数 外 完全 确定 ， 则 应 首先 估计 这 大 个 参数 ， 然 后 
再 进行 拟 合 优 度 检验 ， 惟 一 的 变化 是 此 时 了 的 渐 近 x 分 布 的 自由 度 为 c-1 - k, th 39 
是 说 ， 估 计 一 个 参数 ， 自 由 度 应 减 去 1， 然 而 只 有 参数 以 某 种 合适 的 方式 估计 时 ， 自 
由 度 才 可 以 减 去 1， 例如， 在 一 个 分 成 4 类 的 拟 合 优 度 检 验 中 , # T >7.815 ( 见 表 
A2) ， 通 常 应 拒绝 H, (Œ a =0.05). 然而 ， 如 果 在 检验 前 就 用 数据 估计 一 个 参数 ， 
则 修正 的 假设 分 布 可 以 更 好 地 同 数据 拟 合 . (如 果 这 个 估计 是 一 个 “好 ”的 估计 ， 则 
修正 后 的 假设 分 布 会 同 数据 拟 合 得 很 好 .一 个 不 好 的 估计 会 导致 分 布 与 数据 拟 合 得 
不 好 ， 那 么 拟 合 优 度 检 验 可 能 不 再 有 效 ，Chase(1972 ) 讨论 了 当 独 立 于 数据 估计 参数 
时 的 x 检验 . ) 

拟 合 优 度 检 验 倾向 于 保护 H,， 所 以 检验 比较 保守 ， 且 检验 的 功效 不 高 ， 我 们 希 
望 扩大 临界 域 使 得 a =0.05， 并 找 回 检验 失去 的 功效 ， 若 我 们 减 去 1 个 自由 度 ， 如 用 
2 个 自由 度 代替 3， 就 可 以 扩大 临界 域 ， 这 时 当 T>xaw(2) =5.991 (MERE ya s (3) 
=7.815) 时 ,拒绝 及 ， 问 题 是 :“ 能 证 明 我 们 减 去 1 个 自由 度 的 做 法 合理 吗 ?” 

Cramér( 1946 ,p. 424 或 见 Birnbaum ,1962 ,p. 258) 证 明 如 果 1 个 参数 由 最 小 这 方 
法 估计 所 得 ， 则 可 以 减 去 1 个 自由 度 ， 最 小 x 方法 就 是 在 x 检验 统计 量 中 给 定 观 测 
值 使 统计 量 达到 最 小 的 参数 值 来 估计 参数 ， 实 际 操作 中 就 是 将 参数 的 所 有 可 能 值 ， 
或 几 个 未 知 参 数 的 所 有 可 能 组 合 带 人 公式 中 计算 E, 和 T， 然 后 找到 使 了 最 小 的 参数 
值 ， 然 而 ， 这 个 过 程 是 繁琐 的 ， 因 此 Cramér 提出 了 一 种 更 可 行 的 修正 最 小 好 方法 
( modified minimum chi-squared method) ， 但 这 仍然 很 繁琐 .所 以 Cramér 和 Birnbaum 
在 他 们 给 出 的 例子 中 ， 实 际 用 的 是 修正 最 小 x 方法 的 一 个 修正 ， 如 果 使 用 这 种 估计 
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方法 来 估计 一 个 参数 ， 则 渐进 地 允许 减 去 1 个 自由 度 . 实际 参数 估计 方法 是 通过 计 


算 分 组 数据 的 前 大 阶 样本 和 矩 来 估计 大 个 参数 ，( 假 设 每 个 观测 位 于 所 在 组 区 间 的 中 点 
处 ， 所 有 包含 观测 的 区 间 长 都 有 限 . ) 然后 令 前 大 阶 总 体 矩 与 分 组 数据 的 前 大 阶 样本 
和 矩 相 等 ， 由 大 个 联 立 方程 解 出 上 个 参数 ， 下 面 的 例子 和 后 面 的 评注 可 以 帮助 我 们 弄 明 
白 上 述 方 法 . 
例 4.5.2 
Efron 和 Morris( 1975 ) 提供 了 1970 年 大 联盟 棒球 队 排 在 前 18 名 的 运动 员 45 次 出 棒 
的 记录 .运动 员 的 名 字 和 他 们 45 次 出 棒 击 中 的 次 数 如 下 : 
Clemente 18 Kessinger 13 Scott 10 
F. Robinson 17 L. Alvarado 12 Petrocelli 10 
F. Howard 16 Santo 11 E. Rodriguez 10 
Johnstone 15 Swoboda 11 Campaneris 9 
Berry 14 Unser 10 Munson 8 
Spencer 14 Williams 10 Alvis 7 
我 们 将 检验 零 假 设 ; 这些 数据 服从 n=45 的 二 项 分 布 ， 但 我 们 首先 需要 估计 每 次 出 
棒 击 中 的 概率 p=P ( 击 中 ). 
对 于 p， 一 个 好 的 估计 是 用 这 些 数据 中 击 中 的 相对 频数 来 估计 . 
p = 总 击 中 次 数 / 总 出 梯次 数 = 21 = 0.2654 G) 
然后 计算 n=45, p =0. 2654 的 二 项 分 布 的 概率 ， 
P(X=i)= ( (0.2654)(07346)5'  i=0,1,...,45 (6) 
每 格 期 望 的 观测 数 为 
Ei=18.P(X=iD  i=0,1,...,45 (7) 
将 期 望 观测 数 小 于 0. 5 的 格子 合并 起 来 ， 这 样 做 是 统计 量 了 的 分 布 有 较 好 的 六 Ard 
逼近 ， 合 并 后 的 结果 如 下 : 
击 中 数 
<7 8 9 10 1 12 13 14 15 16 17 218 总 和 
观测 值 1 1 1 5 2 1 1 2 1 1 1 1 18 
期 望 值 110 106 157 204 235 240 220 182 136 092 0.57 061 18 
检验 统计 量 为 
T=$ ON=2473-18=673 (8) 


ix] ~! 
因为 T< 妇 sw(12-1-1) =) | (10) =18.31 (自由 度 为 10 的 x 分 布 的 0. 95 分 位 数 ， 
由 表 A2 获得 ) ， 所 以 在 a =0. 05 的 水 平 下 接受 H,. 事实 上 ，7 的 观测 值 为 6.73， 由 
表 A2 可 得 ，p- 值 大 于 0.25， 所 以 二 项 分 布 同 数据 拟 合 得 相当 好 注意， 这 里 我 们 
为 什么 要 将 自由 度 减 去 一 个 1， 是 因为 参数 p 是 用 数据 估计 的 . m: 
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评注 

例 4.5.2 中 用 18 个 与 动员 的 总 击 中 次 数 / 总 出 棱 次 数 来 估计 参数 p， 这 个 估计 相 
当 好 ， 但 不 一 定 就 是 使 得 了 达到 最 小 的 估计 ， 与 渐 近 理论 一 致 ， 因 为 估计 了 一 个 参 
数 p， 所 以 自由 度 应 减 去 1， 这 里 需要 注意 两 点 . 

第 一 , 例 4.5.2 中 p- 值 大 大 超过 0.25， 所 以 零 假设 很 容易 接受 ， 这 里 没有 必要 去 
找 了 的 最 小 值 来 进一步 提高 P- 值 .结论 还 是 一 样 ， 即 二 项 分 布 同 数据 拟 合 得 相当 好 ， 
因此 除非 P- 值 相当 小 且 对 结论 有 所 怀疑 外 ， 没 有 必要 再 找 最 小 太 统计 量 . 

第 二 ， 用 最 小 Xx 方法 估计 参数 时 ， 判 断 是 否 减 去 一 个 自由 度 的 理论 实际 上 是 一 
种 渐 近 论 (样本 趋 于 无 穷 ， 且 每 个 单元 格 的 期 望 观测 数 也 趋 于 无 穷 )， 而 对 小 样本 情 
形 ， 用 最 小 x 方法 不 能 保证 能 得 到 充分 的 近似 ,但 实际 生活 中 我 们 常 碰 到 小 样本 ， 
因此 我 们 可 能 用 传统 的 估计 方法 来 估计 未 知 参数 更 牢靠 ， 比 如 和 矩 估 计 或 极 大 似 然 估 
计 , 或 者 我 们 知道 对 被 检 样 本 用 最 小 Xx? 方法 时 , x* 近似 也 比较 好 ， 关 于 这 个 论题 更 
详尽 的 论述 见 Yule 和 Kendall( 1950)，Chernoff 和 Lehmann( 1954) 及 Berkson( 1980). 

前 面 两 个 例子 中 所 讨论 的 随机 变量 都 是 离散 型 随机 变量 ， 事实 上 , x 拟 合 优 度 
检验 并 不 限于 离散 型 随机 变量 情形 ， 它 也 可 以 检验 数据 是 否 来 自 于 某 一 指定 的 连续 
分 布 ， 并 且 同 例 4. 5. 2 一 样 ， 其 中 的 某 些 未 知 参 数 可 通过 数据 来 估计 ， 第 一 步 通过 分 
区 间 来 离散 化 连续 型 随机 变量 ， 这 些 区 间 即 为 检验 中 的 分 类 . 当 零 假设 为 真 时 ， 每 
一 区 间 中 的 观测 数 O, 将 与 期 望 的 观测 数 

E, = N- P(X 在 区 间 j 中 ) (9) 
进行 比较 . 

下 面 的 例子 帮助 我 们 了 解 ， 如 何 对 含有 两 个 未 知 参 数 的 连续 分 布 进行 拟 合 优 度 
检验 ， 注 意 ， 如 何 分 区 间 比 较 主观 ， 因 此 这 是 用 x 优 度 检 验 来 检验 连续 型 分 布 时 的 
一 个 薄弱 环节 . 

例 4. 5.3 
从 一 个 电话 簿 中 随机 抽取 50 个 两 位 数 ， 并 用 x 拟 合 优 度 检 验 来 检验 这 50 个 观测 是 
耕 来 自 于 航 从 正 态 分 布 的 总 体 ， 将 数据 按照 升序 排列 如 下 : 


2 23 24 2 2 31 32 3 3 35 
3 3 4 4 B B 4 45 B B 
54 54 56 57 57 58 58 58 58 59 
6 61 62 63 64 65 6 68 6 70 
73 73 74 75 7 8 8 89 9 9 
零 假 设 是 : 
Ho: 这 些 观 测 来 自 于 正 态 分 布 的 随机 变量 


正 态 分 布 有 两 个 参数 ( 见 定 义 1.5.3), 但 零 假设 中 并 没有 确定 它们 的 具体 值 ， 因 此 
在 用 拟 合 优 度 检验 前 需要 把 它们 估计 出 来 ， 整 个 过 程 分 为 如 下 几 步 . 

第 一 步 ” 将 观测 分 别 归 入 长 度 有 限 的 几 个 区 间 中 .我们 可 任意 选择 区 间 ， 比 如 20 一 
40, 40—60, 60—80 和 80 一 100， 其 中 不 包括 每 个 区 间 的 上 限 . 
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区 间 段 
20 一 40 40 一 60 60 一 80  80— 100 总 和 


aae | | e | s | s | s 


第 二 步 ” 用 分 组 数据 的 样本 均值 X PIRA S A4kiku o. j$PCHJE: 20—40 的 
12 个 观测 都 看 作 这 段 区 间 的 中 点 值 0，40 一 60 的 18 个 观测 都 等 于 50， 等 等 ， 然 后 用 
这 些 数 按照 定义 2. 2. 3 的 公式 算出 样本 均值 X 和 样本 标准 差 S. 


[12(30) + 18(50) + 15(70) + 5(90)] = 55.2 (10) 


1⁄2 
= l [12(30)2 + 18(50) + 15(70) + 5(90)*] 一 652} =18.7 (111) 
因此 , u Ao 的 估计 分 别 为 55.2 和 18.7. 
第 三 步 ” 用 第 二 步 得 到 的 人 和 的 估计 ， 计 算 第 一 步 中 的 所 有 区 间 段 的 和 尾 
部 概率 . 


类 的 边界 b (b, — X)/S = x, F(x,) 区 间 段 p; 
b, = 20 一 1.88 0.03 <20 0.03 
b, = 40 —0.813 0.21 20 — 40 0.18 
b, = 60 +0.256 0.60 40 — 60 0.39 
b, = 80 +1.33 0.91 60 — 80 0.31 
b; = 100 +2.40 0.99 80 — 100 0.08 
> 100 0.01 


当 假 设 分 布 是 均值 为 55.2， 标 准 差 为 18.7 的 正 态 分 布 时 ， 为 了 找到 观测 在 不 同类 
中 的 假定 概率 ， 我 们 认为 类 的 边界 ( 表 中 的 第 一 列 ) 是 假定 分 布 的 分 位 数 ， 这 些 分 
位 数 可 通过 公式 1. 5. 3 转化 为 服从 标准 正 态 分 布 的 随机 变量 (第 二 列 ) 的 分 位 数 ， 
通过 查 表 找 出 边界 代表 的 是 哪个 分 位 数 〈 第 三 列 ) ， 第 三 列 中 的 后 一 项 减 去 前 一 项 
就 可 以 得 出 观测 在 假设 分 布下 落 入 每 区 间 段 的 概率 p;， 由 (1) R, E, =50p/, #l 
表 如 下 : 


<20 20-40 40-60 60-80 80-100 > 100 


TE 
maso, [o |n | 


由 于 一 些 E 太 小 ， 将 第 一 个 和 最 后 一 个 单元 格 合并 成 如 下 表 : 
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pase, [os| ms [as [ae 
sso, [2 e Ts Ts 


第 四 步 HET. 用 (2) 式 计算 检验 统计 量 为 

r = (2 7 , (18 — 05 -B7 6 -e -0401 023 
临界 域 对 应 着 7>xaw (c-1-k) =Xo%s (4-2-1) =xos (1) =3.841 (自由 度 
为 1 的 好 分布 的 0.95 分 位 数 ， 由 表 A2 获得 ) ， 而 T=0.401 <3.841， 所 以 应 接受 
H,, H p-fË K + 0.25. 

用 分 组 数据 估计 方差 ， 当 中 间 区 间 段 等 宽 时 (比如 长 度 都 为 h)， 这 时 通常 用 
Sheppard 修正 法 做 一 些 修正 . Sheppard 修正 法 是 将 S 减 去 及 /12， 以 获得 较 好 的 方 
差 估 计 ， 本 例 中 ,，h =20 (区 间 宽 度 ) ， 所 以 在 第 二 步 可 将 方差 减 去 20 /12 = 33. 33， 
然后 求 平 方 根 ， 结 果 为 S=17.8， 是 o 的 一 个 较为 小 些 的 估计 ， 这 个 偏 小 的 o 的 估 
计 会 使 本 例 中 的 了 增 大 ， 因 为 我 们 的 目标 是 获得 使 了 尽 可 能 小 的 估计 ， 所 以 本 例 中 
我 们 没有 用 这 个 修正 ， 在 很 多 情形 下 ， 我 们 希望 修正 后 的 了 变 得 更 小 . 

本 例 的 另 一 个 特点 是 用 X= 55. 04 和 s = 19.0 分 别 估计 疡 各 时， 可 以 获得 了 
的 一 个 较 小 值 (0.279), 55.04 和 19.0 是 分 组 前 由 原始 数据 计算 样本 和 矩 得 到 的 ， 不 
管 我 们 怎样 得 到 它们 ， 所 用 的 这 些 估计 是 使 得 了 变 小 的 估计 ， 在 很 多 情形 中 ， 本 例 
中 用 到 的 步骤 可 以 依赖 于 提供 一 个 与 了 的 最 小 值 差 异 不 大 的 T 值 ， 所 以 这 种 处 理 步 
又 是 值得 推荐 的 . m 

上 例 中 ， 当 我 们 用 分 组 前 〈 不 是 分 组 后 ) ARREA X A S RKA u A o 
时 ， 检 验 统计 量 碰巧 最 小 ， 所 以 上 述 处 理 步骤 也 曾 被 Yule 和 Kendall (1950) 推荐 使 
用 ， 但 是 在 使 用 分 组 数据 时 ， 其 他 一 些 用 于 分 组 数据 的 方法 往往 优 于 它 ， 见 〈Cher- 
noff 和 Lehmann 1954). 
口 理 论 ” 如 果 零 假设 中 假设 的 分 布 完全 给 定 ， 若 H, 为 真 ， 则 分 类 确定 后 ， 观 测 在 每 
类 中 的 概率 p, 也 就 已 知 ， 对 于 样本 容量 为 N， 每 类 中 观测 数 分 别 为 0 O,, 0, O, 
的 概率 为 : 
P(O, Oz ON) = BO Oq Pp (13) 


这 是 一 个 多 项 分 布 ， 是 将 数据 分 成 两 类 满足 二 项 分 布 的 情形 ， 推 广 到 将 数据 分 成 c 类 
情形 的 分 布 ， 由 (13) 式 中 的 分 布 函数 ， 可 得 了 的 概率 分 布 ， 当 N fl c 很 大 时 ， 计 
算 虽 很 复杂 但 了 的 概率 分 布 仍 可 得 到 .关于 从 样本 中 估计 几 个 参数 时 ， 寻 求 了 的 精 
确 分 布 似乎 没有 什么 理论 发 展 ， 因 此 ， 在 用 拟 合 优 度 检验 方法 时 ， 大 样本 逼近 既 实 
用 又 必要 ， 关 于 大 样本 x? 逼近 理论 可 参考 Cramér( 1946). 口 
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Slakter ( 1966, 1968 ) Dahiya ( 1971 ) 和 Gurland ( 1972 , 1973 ) Pahl ( 1969 ) 以 及 
Koehler 和 Larntz( 1980) 讨论 了 具有 较 小 期 望 观测 频数 情形 时 的 xy 拟 合 优 度 检验 ， 所 
有 的 E, = 1 情形 的 精确 表 可 查阅 Zahn 和 Roberts(1971)， 如 果 样 本 数据 是 根据 观测 出 
现 的 时 间 而 不 是 观测 值 分 组 时 ， 则 检验 的 使 用 需要 做 一 些 修 正 (Putter ,1964 ) Chernoff 
(1967) 讨 论 了 估计 参数 后 自由 度 的 调整 ， 关 于 x 拟 合 优 度 检 验 的 进一步 探讨 可 参考 
Efron 和 Morris(1975) ，Molinari(1977) 以 及 Hewett 和 Tsutakawa( 1972) ， 同 其 他 拟 合 优 
度 检验 的 比较 可 参考 Holst( 1972) ，Cohen 和 Sackrowitz( 1975) 及 Horn( 1977). 


习题 


l. 检验 下 列 数据 看 是 否 来 自 于 0.0000 和 0. 9999 之 间 均 匀 分 布 的 总 体 . 
0.4755 0.5233 0.5440 0.5456 0.9056 
0.2186 0.7500 0.2484 0.5101 0.8283 
0.5112 0.5484 0.5758 0.3607 0.4352 
0.3826 0.6454 0.9145 0.3943 0.5381 
0.5758 0.8620 0.6687 0.3979 0.5646 
0.4274 0.5482 0.3007 0.4438 0.4102 
0.4295 0.5926 0.6521 0.6328 0.5689 
0.7297 0.3768 08403 0.2925 0.2113 
0.8757 0.4403 0.4993 0.3900 0.5166 


0.8230 0.8522 0.8312 0.7979 0.4632 
0.8432 0.4004 0.4295 0.9763 0.5590 


0.4396 0.2595 0.3003 0.3003 0.5836 
0.5337 0.8008 0.4887 0.2172 0.9329 
0.5498 0.3686 0.4067 0.5274 0.4579 
0.9096 0.4995 0.2172 0.6793 
2. 掷 600 KET, Ba F 263: 
出 现 的 点 数 1 2 3 4 5 6 
频率 87 96 108 8 122 98 
问 这 枚 仍 子 是 否 均匀 ? 
3. ”用 例 4.5.2 中 每 个 运动 员 的 击 中 数 来 检验 如 下 零 假设 ，H :18 个 运动 员 击 中 的 概率 相同 . 
注意 二 项 分 布 的 一 个 假定 是 对 所 有 基本 试验 来 说 概率 相同 ， 这 也 是 检验 例 4. 5.2 中 假设 的 
一 种 方法 . 
4. 没有 书 和 表 的 帮助 ， 试 着 写 300 个 随机 个 位 数字 ， 然 后 用 例 4. 5. 2 中 使 用 的 随机 性 检验 来 
判断 你 是 不 是 一 个 好 的 随机 数 生成 器 . 
5. 去 年 在 Methodist 医院 出 生 的 婴儿 数 如 下 : 
冬季 36 春季 465 夏季 42 秋季 55 
检验 如 下 假设 ， :去 年 四 个 季度 婴儿 出 生 数 服 从 均匀 分 布 . 
6. 现 有 26 个 观测 的 样本 ， 要 检验 它 是 否 来 自 均值 为 2， 标准 差 为 3 的 正 态 分 布 总 体 ， 已 知 没 
有 一 个 观测 在 这 个 分 布 的 下 四 分 位 数 以 下 ， 有 12 个 观测 在 上 四 分 位 数 以 上 ,6 个 观测 低 于 
中 位 数 ，8 个 观测 位 于 中 位 数 与 上 四 分 位 数 之 间 ， 问 这 些 观 测 是 来 自 于 上 述 的 正 态 分 布 吗 ? 
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4.6 相关 观测 的 Cochran 检验 


有 时 ， 给 对 象 某 种 处 理 或 条 件 的 使 用 会 导致 两 个 结果 ， 例 如 对 销售 技巧 有 
“ 卖 ”与 “不 卖 ” 两 种 反应 ， 或 给 对 象 某 种 处 理 可 能 导致 “成 功 ” 或 “失败 ”两 
个 结果 .当然 ， 在 几 个 不 同 且 独立 的 基本 试验 中 ， 如 果 有 c 个 处 理 ， 且 每 个 处 理 
得 到 两 个 结果 ， 则 整个 结果 可 以 用 2 xc 列 联 表 表示 ， 其 中 一 行 表 示 成 功 数 ， 另 一 
行 表示 失败 数 ， 并 且 可 用 4.2 节 所 描述 的 x 列 联 表 检 验 来 检验 零 假设 : 无 处 理 差 
F. 然而， 我 们 经 常 要 区 分 处 理 方法 间 更 微小 的 差异 . 这 就 需要 对 相同 的 区 组 独 
立地 用 所 有 c 种 处 理 来 提高 检验 的 功效 ， 比 如 在 试验 中 用 c 种 销售 技巧 向 每 位 顾客 
推销 产品 ， 然 后 记录 下 每 种 技巧 对 每 个 人 的 影响 ， 因 此 每 一 块 或 每 个 人 ， 在 自愿 
状态 下 做 出 反应 ， 这 样 的 处 理 也 就 更 有 效 . 这 种 试验 性 技巧 称 为 “区 组 化 ”， 我 们 
称 这 种 试验 设计 为 “随机 化 完全 区 组 设计 ”". 如 果 处 理 结 果 可 归 入 两 类 中 的 某 一 
类 ,下 面 的 检验 方法 是 一 个 合适 的 分 析 方 法 ， 这 个 检验 方法 称 为 Cochran 检验 ， 它 
是 由 Cochran( 1950) 提 出 . 


> Cochran 检验 


数据 独立 地 用 c 种 处 理 方法 分 别处 理 > 区 组 或 个 对 象 ， 每 种 处 理 后 的 结果 根据 
“成 功 ” 和 “失败 ”( 或 其 他 可 能 处 理 结 果 的 两 种 区 分 ) 分 别 记 为 “0” 和 “1”， 然 
后 将 结果 放 入 一 张 r xc 列 联 表 中 ， 其 中 行 代表 每 区 组 ，c 列 代表 c 种 处 理 方式 ， 每 格 
的 值 要 么 为 0， 要 么 为 1， 记 RR,i=1,2,…,r 为 行 总 和 ，C,,j =1,2,…,c 为 列 总 和 ， 
则 数据 可 整理 如 下 : 


处 理 
区 组 1 2 C 行 总 和 
1 Xil X12 X, R; 
2 Xa Xn Xy R 
r Xn Xn Ç R, 
列 总 和 G C, C, N = 总 和 
其 中 ，X; =0 或 1，N 为 表 中 1 的 总 数 . 


假定 条 件 
1. r 个 区 组 是 从 所 有 区 组 组 成 的 总 体 中 随机 选取 的 . 
2. 处 理 的 结果 可 以 按照 某 种 方式 对 每 个 区 组 内 的 所 有 处 理 进行 两 种 区 分 ， 所 以 
结果 可 记 为 “0” 或 “1”. 
检验 统计 量 检验 统计 量 了 可 写 为 
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> (c, = Ny 
r gm: 
T= cfe - U— — (1) 

2 Ri (: R.) 

i=1 

下 面 的 表达 式 用 于 计算 更 加 合适 
cfc — DZ C?- (c — DN? 
T (2) 


r 
cN — > R 
i=1 


零 假 设 7 的 精确 分 布 是 难以 求 得 的 ， 所 以 我 们 用 大 样本 逼近 后 的 分 布 来 代替 ， 即 假 
设 区 组 数 + 相当 大 ， 则 零 分 布 可 近似 为 自由 度 为 c -1 的 Xx 分 布 . 
假设 
Ho: 所 有 的 处 理 效果 相同 
HAE AARAA E 
我 们 可 以 用 数学 语言 来 描述 上 述 假 设 , 记 p, =P( 列 7 中 出 现 “1” 的 概率 )， 则 所 有 
处 理 之 间 等 效果 的 假设 可 描述 为 ; 
Ho: 在 每 个 区 组 中 有 pi =p =… = p. 
处 理 间 效果 有 差异 即 为 : 
及 1: 对 某 两 个 处 理 i 和 j 有 p, p, 

车 T>x?_,(c ~1)( 自 由 度 为 c-1 的 x 分布 的 1-a 分 位 数 ， 可 由 表 A2 获得 ) WE 
绝 有 ,，p- 值 近似 为 一 个 自由 度 为 c - 1 的 x 分 布 的 随机 变量 大 于 了 的 概率 ， 它 可 从 表 
A2 中 查 得 . 
多 重 比较 ET H, ， 则 可 用 McNemar 检验 对 各 种 处 理 方法 进行 成 对 比较 ，Mc- 
Nemar 检验 是 一 种 双边 符号 检验 ， 在 3.5 节 中 可 以 查 到 . 
计算 机 辅助 ”Cochran 检验 可 在 StatXact PRS). 一 一 一 一 一 一 一 一 

例 4.6.1 

3 个 篮球 爱好 者 分 别 设计 了 一 个 系统 来 预测 学 院 篮球 比赛 的 结果 .他 们 随机 选取 12 

场 比 赛 并 让 每 位 运动 员 对 每 场 比 赛 的 结果 作出 预测 ， 所 有 比赛 结束 后 的 结果 记录 如 

F O 代表 成 功 的 预测 ，0 代表 错误 的 预测 ) : 


= 


Ë 
= 


pi ey SS aG La: i NL 


比赛 1 


1 ONA Q i. 92 2 =— 
== — — = — = = 
= — — Ó Ó = = 
@ QÓ O Ñ = Ç QÓ 3 
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8 1 1 0 2 
9 0 0 1 1 
10 0 1 0 1 
11 1 1 1 3 
12 1 1 1 3 
总 和 8 10 7 25 


因为 比赛 (KA) 是 从 正在 进行 的 学 院 比赛 中 随机 选取 的 ， 所 以 满足 Cochran 检验 
的 假设 条 件 ， 因 此 我 们 用 Cochran 检验 来 检验 零 假 设 ; 

Ho: 每 个 运动 员 以 他 的 能 力 来 预测 篮球 比赛 是 等 有 效 的 
用 (1) 式 计算 检验 统计 量 为 


_ (3)@Q)[(— b° + (92 + (— 92] _ 
2 十 2 二 之 十 4 十 之 @) 


近似 水 平 为 0. 05 的 临界 域 对 应 着 了 >xaw(2) =5.99 (自由 度 为 2 的 x 分 布 的 0. 95 
分 位 数 ， 可 由 表 A2 获得 ) ， 因 为 了 =2.8 <5.99， 所 以 接受 已 ， 因 此 ， 我 们 得 出 所 
用 的 预测 方法 没有 显著 差异 ， 在 a 约 为 0.25 时 ，H, 也 被 拒绝 ， 故 疡 值 为 0.25. W 
口 理论 ”每 个 所 定义 的 X 服 从 参数 为 的 伯 努 利 分 布 (n=1 的 二 项 分 布 ) ， 在 零 假 
设 下 ， 每 一 行内 所 有 的 X, 都 是 一 样 的 ， 但 是 当 区 组 变化 时 ，X; 可 以 不 同 . 定义 列 总 
和 C, 为 
c= Xx, (4) 
因此 C, 也 是 随机 变量 ， 因 为 C, 是 7 个 独立 随机 变量 之 和 ， 所 以 当 r 较 大 时 ， 利 用 中 
心 极限 定理 得 出 7 的 分 布 近似 为 正 态 分 布 ， 即 
C; — E(C) 
VVar (C) 
的 分 布 函数 近似 为 标准 正 态 分 布 函数 ， 并 且 ， 由 定理 1.5.3 知 ， 和 式 
e [C; = B(Cy T <: [CG;— EROF 
i =l f Var(C) 
可 以 用 自由 度 为 c 的 好 分 布 近似 ， 然 而 ， 参 数 E( Ci) 和 Var( Ci) 未 知 ， 所 以 下 面 的 参 
数 估计 方法 将 导致 减少 1 个 自由 度 ， 这 个 方法 由 Blomqvist( 1951) 给 出 . 
E(C,) 可 由 样本 均值 来 估计 


52 Ci = ~ = E(C;) 的 估计 (6) 


(5) 


产 ]1 


同样 的 估计 用 于 估计 每 个 E(C)) , j=1,2,…,c，C, 的 方差 为 25 的 方差 对 了 k n, Ep 
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Var (C;) = 5 Var (X;;) (7) 
i=] 


因为 当 区 组 变化 时 ，X, 相 互 独立 ( 见 定理 1.4.3)， 所 以 由 (1.4.8) 式 给 出 的 X; 的 
方差 为 

Var (X;) = p(l — p) (8) 
在 零 假设 H, 下 ， 每 行 中 所 有 列 “ 成 功 ”的 概率 相同 ， 因 此 对 每 一 行 ， 我 们 自然 地 用 
行 i 成 功 的 平均 数 R /c 来 估计 p， 即 

行 i 中 p 的 估计 = Ri/c (9) 
HH (8) 式 


R; Ri 
Var (Xi) 的 估计 = ( 一 °) (10) 


C 
然而 ， 这 种 估计 有 偏 小 的 趋势 ， 所 以 我 们 将 (10) 乘 上 因子 c/(c-1), W Var(X) 
由 下 式 估计 : 


ilc — Ri 
Var Co ) 的 估计 = EEA a1) 


c(c — 1) 
HH (7) 式 知 ，Var( C, ) 的 估计 可 取 为 : 
Var Ci) 的 估计 er > Ri(c — R) (12) 


它 与 了 无关， 所 以 对 所 有 C 都 成 立 , 将 E(C)((6) 式 ) 和 YVar(C)((12) 式 ) 的 估计 
WA (5) 式 中 ， 得 到 


Š R.(e — R) (3) 
i=] 
这 就 提供 了 统计 量 T 的 分 布 可 由 自由 度 为 c-1 的 x 分 布 近似 的 某 种 直观 理解 . 口 
Berger 和 Gold ( 1973 ) 及 Bhapkar 和 Somes ( 1977 ) 探讨 了 Cochran 检验 ，Patel 
(1975) 讨论 了 检验 统计 量 的 精确 分 布 ，Cochran 检验 方法 用 于 其 他 模型 的 例子 可 参考 
Fleiss( 1965). Tate 和 Brown 考虑 了 大 样本 逼近 问题 . 
评注 
若 仅 考虑 两 种 处 理 ， 比 如 同一 区 组 (r 区 组 ) 上 的 观测 有 “处 理 前 ”与 “处 
理 后 ”两 种 情况 ， 试 验 情 形 也 与 McNemar 对 变化 的 显著 性 检验 中 所 分 析 的 相同 ， 
即 每 种 情况 下 零 假 设 是 : 总 体 在 类 1 中 的 比例 在 处 理 1 (处 理 前 ) 和 处 理 2 (处 理 
后 ) 相同 ， 因 此 如 果 c =2， 试 验 者 可 选用 Cochran 检验 或 McNemar 检验 .事实 上 ， 
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当 c=2 时 ， 则 没有 选择 ， 此 时 Cochran 检验 与 McNemar 检验 ( 见 3.5 节 ) 相同 ， 


原因 如 下 . 


当 c=2 时 ，Cochran 检验 统计 量变 为 


BAG -24G (c, -ay 


Š R2- R) 


o_oy, /a_a 
Bea a anl 
Š R2- R) 
i=] 
(C-C 
Š R @ — R) 
i=] 
若 某 区 组 在 两 列 中 都 为 1, WR =2 H R,(2 - R) =0， 同 理 ， 若 两 列 都 为 0， 则 R, =0 
H R(2-R,)=0. 若 在 某 行 中 两 列 分 别 为 0，1 或 1, 0, M| R. =1 H R,(2-R,) =1. 
因此 (14) 式 的 分 母 只 包含 两 列 分 别 为 0，1 或 1, 0 的 行 总 和 ， 即 McNemar 检验 中 
的 b+c (W), B C, 是 第 一 列 中 或 “处 理 前 ”的 个 数 ， 即 McNemar 检验 中 的 c + 


d (记号 ) ， 类 似 地 ，C: =b+4d， 因 此 我 们 有 
CGa—- CG =c+d-b-4d 


(14) 


H. (14) 式 可 化 为 
(c-b? _ (b-c) 
a b+c b+c 
这 与 (3.5.1) 式 给 出 的 McNemar 检验 统计 量 形式 相同 ， 当 c =2 时 ，McNemar 检验 
统计 量 与 Cochran 检验 统计 量 都 可 由 自由 度 为 1 的 x 分 布 近似 . 


习题 


1. 同时 对 12 个 家 庭 主妇 自愿 者 使 用 两 种 不 同 的 销售 技巧 ， 要 检验 这 两 种 技巧 的 相对 有 效 
性 ， 两 种 销售 技巧 目的 是 让 每 个 家 庭 主妇 买 某 种 产品 ， 在 整个 过 程 中 ， 产品 不 变 ， 试验 
结束 后 ， 如 果 某 个 技巧 令 一 个 家 庭 主 妇 同 意 购买 这 种 产品 ， 则 记 为 1， 否则 记 为 0， 结 果 
如 下 : 


家 庭 主妇 
1 2 3 4 5 6 7 8 9 0 1 1 
技巧 1 1 1 1 1 1 0 0 0 1 1 0 1 
a2 Ü: t Y o O DO o D l ¿CO D a 
(a) 用 Cochran 检验 . 
(b) 重新 安排 数据 ， 然 后 使 用 (3.5.1) 式 建 议 的 大 样本 形式 的 McNemar 检验 . 
(c) 忽略 这 个 试验 中 的 区 组 效应 ， 将 数据 看 成 使 用 24 个 不 同 家 庭 主 妇 的 结果 ， 用 第 4.1 
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节 中 的 概率 差异 检验 来 分 析 数 据 ， 与 Cochran 检验 相 比 较 并 做 讨论 . 

2. 在 一 条 船上 ， 将 水 手 随机 地 分 为 12 组 ,每 组 3 人 ， 每 组 的 水 手 都 在 船 的 同一 地 方 干 相似 
的 工作 . 对 每 组 的 每 个 水 手 随机 地 使 用 治疗 方法 1, 2 或 3， 且 对 同 组 中 三 个 水 手 的 治疗 
两 两 不 同 ， 治 疗 方法 1 是 “打针 ”， 治 疗 方法 2 是 “ 吃 药 " ， 治 疗 方法 3 是 “没有 患 感冒 
者 有 两 个 星期 的 假期 "， 只 要 每 个 水 手 报告 他 患 感冒 的 情况 ， 试 验 者 就 要 做 一 份 治疗 报 
告 ， 冬 天 结束 后 ， 结 果 如 下 表 : 


内 


患 感冒 的 水 手 ( 治疗 次 数 ) 


N 


@ NDB Q) N — 
4 9 5 


这 些 结果 表明 不 同治 疗 手段 间 有 显著 差异 吗 ? 
3. ”用 计算 机 生成 100 组 人 工 数据 以 比较 3 种 统计 检验 方法 的 相对 功效 ， 对 每 组 数据 分 别 用 这 
3 种 检验 (置信 性 水 平 a 为 0.05) ， 是 否 接受 零 假 设 的 记录 如 下 : 


检验 1 检验 2 检验 3 数据 组 数 
接受 接受 接受 26 
接受 接受 拒绝 b 
接受 拒绝 接受 12 
拒绝 接受 接受 4 
拒绝 拒绝 接受 18 
JE 接受 拒绝 5 
接受 拒绝 拒绝 
拒绝 拒绝 拒绝 27 
问 这 3 种 检验 用 于 所 得 的 模拟 数据 的 总 体 时 ， 其 检验 的 功效 是 否 有 显著 差异 ? 


思考 题 


l. 在 每 个 处 理 区 组 的 组 合 中 ， 替 用 一 个 观测 ， 现 在 在 每 个 格子 中 ,我 们 有 m 个 独立 的 观测 ， 
令 C，R 和 NN 分 别 代表 行 处 理 方法 总 数 , 行 总 和 与 所 有 和 ， 这 与 以 前 定义 的 一 样 ， 证 明 


统计 量 
c N 2 
2 (c - 8) 
T' = mee — 1] ———— 


> R; (mc — R;) 


i=] 
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FJ 了 的 分 布 一 样 也 可 由 自由 度 为 c-1 的 x 分 布 近似 . 
2. 对 本 节 所 设计 的 常用 参数 检验 ， 一 般 假设 观测 样本 来 自 于 正 态 分 布 总 体 ， 而 不 是 n =1 的 二 项 
分 布 总 体 ， 并 使 用 “F- 统 计量 ”检验 ， 如 果 观 测 为 0 或 1， 则 F- 统 计量 可 简化 为 
C > Ct 
= (r — 1) . = 


Nr XR -cX C1+ N 
i=1 


证 明天 与 了 有 如 下 函数 关系 


并 且 对 太 大 的 了 拒绝 H, 等 价 于 对 太 大 的 到 拒绝 Ho. 


4.7 其 他 分 析 方 法 讨论 


似 然 比 统 计量 
本 章 所 描述 的 方法 不 限于 分 析 列 联 表 ， 概 括 起 来 说 ， 所 使 用 的 检验 统计 量 为 ;: 
„= PX% 
T = 3 Oa í) 
所 有 t 


格子 
这 里 O, 为 格子 i 中 的 观测 数 ，E, 为 格子 i 的 期 望 观测 数 ， 检 验 统计 量 T, Hi Pearson 
(1900,1922) 引 入 ,为 了 与 其 他 Xx? 统计 量 区 分 而 被 称 为 “PearsonX 统计 量 "， 下 面 我 
们 将 介绍 一 种 其 他 的 x 统计 量 . 

有 一 种 不 同 的 分 析 方 法 ， 我 们 称 为 似 然 比 检验 法 〈 在 问题 4. 2. 3 中 提 到 过 ) ， 用 
统计 量 


O, 
r= 2 Om (2) 2) 
格子 

代替 T ， 这 里 “ln” 代 表 自 然 对 数 ， 很 多 计算 器 可 计算 . 统计 量 T, 同 T, 一 样 渐 近 
地 服从 同样 自由 度 的 好 分布， 尽管 两 个 统计 量 有 相同 的 渐 近 分 布 ， 但 对 某 一 特定 
的 列 联 表 它们 的 值 可 能 有 很 大 不 同 . 选择 使 用 统计 量 T, A T, 主要 看 使 用 者 的 个 人 

K tf. 
统计 量 T, 也 称 为 “ 似 然 比 x 统计 量 ”， 这 是 因为 它 来 源 于 统计 学 中 的 似 然 比 理 
论 ， 它 属于 Wilks(1935 ,1938) ， 并 因为 源 于 似 然 比 理论 而 受到 广泛 使 用 ， 然 而 ， 使 
用 统计 量 T, 的 一 个 严重 的 弊端 就 是 ， 如 果 N/rc <5, x 分 布 近似 效果 就 会 不 好 ， 但 
是 对 统计 量 T, 来 说 ， 即 使 N 值 偏 小 , y. 分布 近似 效果 仍然 不 错 . Agresti(1990 ) 说明 
了 如 果 r, c 太 大 使 Mre 和 1， 且 “ 列 联 表 中 既 不 包含 太 小 也 不 包含 适当 大 的 期 望 频 
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数 ” 时 ， 那 么 T, 的 分 布 用 x 分 布 近 似 的 效果 不 好 .Agresti 的 发 现 同 我 们 建议 的 所 有 
期 望 值 至 少 为 0.5 且 大 多 数 大 于 1.0 不 一 致 . 


对 数 线性 模型 


还 有 一 个 广泛 使 用 的 分 析 方 法 是 “线性 对 数 模型 "*. 如 果 有 适当 的 计算 机 程序 帮 
助 计算 ,这 种 方法 能 很 好 地 分 析 三 维 以 上 的 列 联 表 ， 我 们 不 推荐 用 手工 计算 . 也 可 
在 线性 对 数 模型 中 使 用 前 面 介绍 的 统计 量 T, 和 7,; 不 同 之 处 在 于 得 到 所 有 E, 所 使 用 
的 方法 .通常 我 们 使 用 迭代 法 ， 因 此 这 需要 计算 机 的 帮助 . SAS,SratMost 和 SYSTAT 
都 有 计算 机 程序 来 完成 多 维 列 联 表 的 对 数 线性 分 析 . 

对 数 线性 模型 的 名 字 来 自 于 下 面 的 原因 ， 在 一 个 双向 列 联 表 中 ， 独 立 性 的 零 假 
设 可 以 用 数学 语言 表示 如 下 : 

Ho: p; = Pis P- HRAB iR, 
这 里 p, 是 观测 归 入 格 (i,j) PRR, p, 和 p. 分 别 为 行列 边际 概率 ， 对 零 假设 两 
边 取 对 数 得 

Ho: log p; = log pi + log prj 
这 是 一 个 线性 等 式 ， 则 对 零 假设 的 检验 归结 为 检验 格子 概率 的 对 数 是 否 是 边际 概率 
的 线性 函数 . 关于 对 数 线性 模型 的 完整 描述 和 分 析 可 参考 Bishop ,Fienberg 和 Holland 
(1975). 建议 初学 者 可 参考 Ku 和 Kullback( 1974) 或 Lee(1978 ) 对 问题 的 初等 处 理 ， 
也 可 参考 Fienberg( 1977 ) 所 写 的 书 . 

感 兴 趣 的 读者 想 进一步 了 解 对 数 线性 模型 ， 可 阅读 下 面 的 文章 : Bishop( 1969, 
1971), ，Fienberg( 1970b ,1972 ) Fienberg 和 Larntz( 1976), Chen 和 Fienberg ( 1976) ， 
Grizzle, Starmer 和 Koch( 1969), Koch 和 Reinfurt( 1971), ，Grizzle 和 Williams(1972 ) ， 
Koch ,Imrey 及 Reinfurt (1972 ) Wagner( 1970), Odoroff (1970 ) ， Goodman ( 1971 ), 
Gart( 1972), Haberman( 1973) 和 Read(1977) ， 以 及 Agresti (1990) 的 书 . 
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l. 丹麦 一 项 研究 计划 试图 找 出 醒酒 是 否 与 遗传 因素 有 关 ，5 位 精神 病 医 师 专门 对 那些 从 婴儿 
时 期 就 与 亲生 父母 分 开 的 男子 做 调查 研究 ， 一 组 中 有 55 名 男子 的 父亲 或 母亲 有 醒酒 的 普 
好 ， 而 这 55 名 男子 中 有 10 名 柄 酒 ， 而 另外 一 组 中 有 78 名 男子 的 父母 都 不 是 柄 酒 者 ， 但 
78 名 男子 中 有 4 名 柄 酒 ， 研 究 发 现 第 一 组 中 柄 酒 有 遗传 是 显著 的 . 你 的 统计 分 析 结 果 如 
faj? ( 引 自 美 联 社 1973 年 2 月 21 日 的 报导 . ) 

2. 大 选 前 随机 地 抽取 200 个 选举 人 的 样本 ,询问 这 200 个 人 愿意 投 哪个 候选 人 的 票 。 其 中 
85 人 投 候选 人 A，111 人 投 候选 人 B，4 票 弃权 .你 如 何 预测 选举 结果 ? (讨论 需要 讨论 
的 内 容 . ) 

3， 向 某 个 社区 学 院 的 几 个 非 大 一 的 学 生 提 了 几 个 问题 ， 包 括 他 们 对 把 吸食 大 麻 合 法 化 有 什 
么 感想 ， 结 果 如 下 
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FERO 。 性 别 “d aaa 喜欢 的 政党 。 大麻 问题 ”大 一 GPA 
1 M 32 N 1 2.66 
2 M 10 D 1 3.18 
3 M 28.5 R 1 2.15 
4 M 3.5 R 2 1.61 
5 M 4 D 4 1.54 
6 F 7 N 5 2.12 
Z M 3.5 R 3 1.35 
8 M 10 N 4 2.26 
9 F 6 R 4 2.70 

10 M 32 D 4 2.84 
11 M 22.5 D 4 2.60 
12 M 7 D 1 1.13 
13 M 6.5 N 4 0.81 
14 M 5 D 1 3.11 
15 M 35 R 1 2.47 
16 M 5.5 D 5 3.15 
17 M 26.5 D 4 2.33 
18 F 24 N 5 2.46 
19 M 32 D 5 3.59 
20 F 5 R 1 2.00 
21 M 5.5 R 1 2.90 
22 M 11.5 N 5 3.26 
23 M 9.5 R 4 2.71 
24 M 25.5 O 3 2.22 
25 M 15 R 1 3.00 
26 F 9 N 4 2.06 
27 M 15 D 1 1.75 
28 M 24 R 3 2.42 
1 = RAN,- .，5 = 完全 同意 . 


(a) 检验 假设 : 政党 偏好 与 对 大 麻 合 法 化 的 态度 独立 . 
(b) GPA 与 社区 距离 有 关 吗 ? 
(c) 估计 社区 距离 的 中 位 数 . 
(d) 估计 女 学 生 的 百分比 . 
(e) 政党 偏好 与 性 别 〈 男 或 女 ) 独立 吗 ? 
(f) 检验 假设 : 男女 学 生 有 相同 的 大 一 学 生 GPA. 
4. 10 名 学 生 需 要 上 一 门 必修 课程 ， 每 位 学 生 都 有 一 个 平时 成 绩 X 和 考试 成 绩 Y， 记 录 如 下 : 


学 生 数 
1 2 3 4 5 6 7 8 9 10 
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(a) 考试 成 绩 是 否 显著 高 于 平时 成 绩 ? 

(b) 记 p= 一 个 学 生 考试 成 绩 高 于 平时 成 绩 的 概率 ， 求 出 p 的 一 个 置信 区 间 . 

(c) 找 出 平时 成 绩 中 位 数 的 一 个 置信 区 间 . 

(d) Y 的 上 四 分 位 数 是 否 显 著 高 于 75? 

考虑 如 下 医学 试验 : 通过 解剖 动物 尸体 ， 测 量 它们 的 肝脏 铁 的 吸收 量 ， 来 决定 乙 硫 氨 基 
酷 酸 是 否 对 动物 的 饮食 有 影响 .随机 选取 34 只 动物 将 其 平均 分 为 两 组 ， 其 中 17 只 动物 的 
食物 中 含有 乙 硫 氨基 酪 酸 ， 另 外 17 只 没有 .将 动物 分 别 配对 (一 组 的 1 对 应 另 一 组 的 1 
等 ) ， 并 给 每 对 喂 等 量 的 食物 .一 段 时 期 后 ， 取 出 动物 的 肝脏 并 用 一 个 温度 为 “ 温 ”《〈37 
BE) 或 “ 凉 ”(25 BF) 的 含 放射 性 铁 溶液 进行 处 理 ， 不 同 肝脏 铁 的 吸收 量 数据 如 下 : 


温 凉 
配对 ” 含 乙 硫 氨基 酷 酸 TE MY 含 乙 硫 氨 基 酶 酸 不 含 
2.59 1.40 9 6.77 4.71 
1.54 1.51 10 4.97 1.60 
3.68 2.49 11 1.46 0.67 
1.96 1.74 12 0.96 0.71 
1.59 13 5.59 5.21 
1.61 1.36 14 9.56 5.12 
1.23 3.00 15 1.08 0.95 
6.96 4.81 16 1.58 1.56 
17 8.09 1.68 
(a) 在 “ 温 ” 的 溶液 中 吃 含 乙 硫 氨基 酷 酸 食物 的 动物 的 肝脏 是 否 比 不 吃 的 那 组 更 容易 吸 
收 溶液 中 的 铁 ? 在 “ 凉 ” 的 溶液 中 情况 如 何 ? 
(b) 温度 低 的 溶液 是 否 能 显著 提高 吃 含 乙 硫 氨基 酪 酸 食 物 的 动物 的 肝脏 对 铁 的 吸收 ? 对 
另 一 组 中 的 动物 情况 又 如 何 ? 
(c) 求 吃 含 乙 硫 氨 基 酷 酸 食物 的 动物 的 肝脏 被 含 放射 性 铁 的 溶液 处 理 后 ， 含 铁 量 的 一 个 
双边 容忍 限 . 
(d) 同 对 中 的 两 只 动物 肝脏 的 铁 吸收 量 是 否 相关 ? 
科学 家 想 了 解 爱斯基摩 人 的 住房 内 的 空气 质量 ， 于 是 他 们 做 了 一 个 试验 ， 考 察 了 20 个 位 
于 Bethel (阿拉 斯 加 州 西南 部 Kuskokwima 河 边 的 一 个 土著 村 ) 的 爱斯基摩 人 居住 的 房 
是 ， 其 中 10 个 是 作为 房屋 发 展 项 目的 一 部 分 而 新 建 的 房子 ， 其 他 10 间 是 标准 的 Bethel 地 
区 土著 住房 ， 试 验 目 标 是 比较 新 旧 住房 每 立方 英尺 空气 中 的 细菌 聚居 数 ， 看 它们 是 否 存 
在 差异 ， 数 据 如 下 : 
老 房 编号 每 立方 英尺 细菌 聚居 数 ”新房 编号 每 立方 英尺 细菌 聚居 数 
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(a) 分 析 数 据 . (b) 求 老 房 细 菌 数 中 位 数 的 一 个 置信 区 间 . 
G. Noether 博士 建议 用 如 下 趋势 性 检验 ， 将 观测 结果 分 到 互 不 重 亚 的 ， 由 3 个 相 邻 数组 
成 的 多 个 组 中 . S 了 等 于 单调 组 (单调 增 或 单调 减 ) 数 ， 比 如 : 

42, 44, 63, 61, 44, 52, 73,72,46, 48, 42, 53 

增加 ° 减少 。 

这 里 了 = 2. 
(a) 在 随机 变量 是 独立 同 分 布 的 零 假 设 下 ， 了 的 分 布 是 什么 ? 
(b) 如 何 找 临界 域 ? 
从 工商 管理 学 院 拥有 的 计算 机 中 随机 抽取 12 台 ， 其 中 有 8 台 是 IBM 型 号 ， 从 医学 院 随机 
抽取 的 36 台 计 算 机 中 有 30 台 是 IBM 型 号 ， 问 : 
(a) 两 个 学 院 拥 有 IBM 型 号 计算 机 的 差异 是 否 显著 ? 
(b) 求 医学 院 拥 有 IBM 计算 机 的 整体 比例 的 一 个 置信 区 间 . 
体育 系 将 投掷 标枪 加 入 到 课程 中 ， 并 决定 在 运动 场 上 应 标 出 多 少 根 标 线 来 标 出 投掷 距离 . 
他 们 要 随机 地 挑选 几 名 学 生 试 投 ， 并 在 学 生 投 掷 的 最 远 和 最 近 处 标 上 标 线 .为 了 能 以 
90 多 的 把 握 保 证 学 生 投掷 标枪 的 距离 至 少 有 95% 在 标 线 所 在 范围 内 ， 问 应 选 多 少 学 生 ? 


. 一 名 经 纪 人 记录 了 两 年 内 他 每 月 售 出 的 地 方 性 债券 数 如 下 : 


一 月 二 月 三 月 四 月 五 月 六 月 
1997 12 16 14 18 18 14 
1998 19 22 20 17 18 20 

七 月 八 月 九 月 十 月 TAR 十 二 月 


1997 10 21 12 18 17 17 
1998 20 16 16 21 24 25 


这 个 记录 是 否 表明 他 售 出 的 债券 数 呈 递增 趋势 ? 


.科学 家 做 了 一 个 检验 大 猩猩 是 否 具有 识别 字母 能 力 的 试验 ， 他 们 将 5 个 不 间 的 字母 随机 


地 放 在 5 个 按钮 上 ， 当 大 猩猩 按 在 字母 E 所 在 的 按钮 上 时 ， 小 灯亮 起 来 ， 然 后 猩猩 会 得 
到 一 个 它 喜 欢 的 香蕉 . 每 天 做 5 次 试验 ， 并 且 字 和 母 在 每 次 试验 后 都 会 被 随机 排列 一 次 . 
试验 持续 了 6 天 ， 结 果 如 下 : 
正确 选择 EE 之 前 按 按钮 的 次 数 
试验 次 数 1 2 3 4 

星期 一 6 
星期 二 7 
星期 三 4 
星期 四 1 
星期 五 5 
星期 六 £ 2 2 
(a) 大 猩猩 在 每 天 的 5 次 试验 中 识别 字母 的 能 力 是 否 有 所 提高 ? 
(b) 大 猩猩 在 一 周 内 识别 字母 的 能 力 是 否 有 所 提高 
(c) 如 果 大 猩猩 随机 地 按 按钮 ， 则 按 按钮 的 次 数 服 从 几何 分 布 ，P(X=k) = (0.2) 

(0.8) :大 =1,2,3…， 检验 假设 : 大 猩猩 是 随机 地 按 按钮 


4 
8 
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12， 一 条 流水 线 上 4 套 检 验 产品 下 交 的 系统 正在 同时 运行 ， 每 个 产品 都 会 被 4 套 系 统 分 别 检 
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验 ， 假 设 系统 没有 第 I 类 错误 ， 即 没有 瑕 症 的 产品 不 会 被 系统 误 检 ， 但 是 有 第 了 类 错误 ， 
即 环 疲 可 能 没有 被 检测 到 ， 我 们 抽取 了 一 组 数据 如 下 : 
系统 1 系统 2 系统 3 系统 4 


产品 1 H SEA EA 
产品 2 JOB, 
产品 3 
产品 4 H SEd F 
品 5 Jr. Har 
产品 6 EEA 
产品 7 
产品 8 fT 3k JBE. 


问 : 4 4 82 £ Bi R ylpp= óh BJ BE JJ EL #+48 25 FE? 
银行 从 一 台 自 动 提 款 机 上 随机 地 抽取 顾客 的 存款 信息 ， 并 希望 找 出 上 四 分 位 数 的 90% 
置信 和 区间， 存款 金额 如 下 : 


748 320 45 1,237 5,883 170 
65 30 83 186 598 8,500 
1,500 4,857 300 100 395 2,450 
349 50 25 637 600 260 
67 200 45 400 v7 580 


求 出 希望 的 置信 限 . 

对 问题 13 中 的 随机 样本 ， 检 验 假设 : 用户 存款 金额 低 于 100 美元 的 概率 等 于 存款 超过 

1000 美元 的 概率 ， 单 边 备 择 假设 : 用 户 存款 金额 低 于 100 美元 的 概率 高 于 存款 超过 1000 

美元 的 概率 . 

H 50 名 男孩 与 他 们 的 父亲 组 成 的 随机 样本 ， 其 中 有 17 名 男孩 吸烟 ，27 人 的 父亲 吸烟 ， 

17 名 吸烟 的 男孩 中 有 12 位 其 父亲 也 吸烟 ， 男 孩 的 吸烟 习惯 与 父亲 的 吸烟 习惯 是 否 显 著 

( 正 ) 相关 ? 这 是 哪 种 类 型 的 列 联 表 ? 

第 50 街 必 胜 客 最 近 雇 了 12 个 男孩 和 8 个 女孩 ， 他 们 需要 6 名 司机 和 14 名 收银 员 ， 他 们 

安排 6 名 男孩 当 司机 ， 检 验 零 假设 : 工作 安排 与 性 别 独 立 .， 单 边 备 择 假 设 为 : 男孩 更 有 

可 能 被 安排 为 司机 ， 求 出 p- 值 . 

轮 盘 赌 的 游戏 中 ， 得 到 红色 的 概率 为 18/38， 得 到 黑色 的 概率 也 为 18/38 ， 得 到 绿色 的 概 

率 为 2/38，500 次 转动 的 结果 为 : 35 次 出 现 绿色 ，241 次 出 现 红色 ， 其 余 为 黑色 . 问 : 

观测 概率 是 否 与 理论 概率 一 致 ? 

假设 环保 局 要 求 你 们 公司 生产 的 汽车 至 少 有 95% 的 汽车 每 加 仓 油 能 跑 20 英里 以 上 . 你 

检验 60 辆 汽车 发 现 它 们 全 都 达到 标准 (每 加 仑 能 跑 20 英里 以 上 )， 你 能 否 以 95% 的 把 

所 保证 你 公司 至 少 95% 的 汽车 每 加 仑 油 能 跑 20 英里 以 上 . 

(a) 在 置信 水 平 a =0.05 下 用 一 种 假设 检验 . 

(b) 对 同样 的 问题 求 出 单 边 95% 置信 区 间 (如 果 你 不 知道 怎样 求 单 边 置信 区 间 ， 你 可 
以 求 出 双边 90% 置信 区 间 ， 然 后 去 掉 另 一 端 ). 

1997 年 间 ，Joe 的 餐馆 中 的 顾客 使 用 万 事 达 信 用 卡 14 次 ， 维 萨 卡 10 次 ， 发 现 卡 4 次 及 
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美国 运通 卡 1 K. 1998 年 间 ， 顾 客 使 用 万 事 达 卡 22 次 ， 维 萨 卡 23 次 ， 发 现 卡 10 次 ， 没 
有 人 使 用 美国 运通 卡 、 从 1997 年 到 1998 年 信用 卡 的 使 用 方式 是 否 有 显著 的 变化 ? 你 所 
使 用 检验 的 名 字 是 什么 ? 

从 某所 大 学 即将 人 学 的 大 一 学 生 中 随机 选取 140 名 新 生 ， 其 中 80 名 学 生 驾 私家 车 到 校 ， 
其 余 没 有 .这 些 新 生 中 有 40 名 考试 不 合格 ， 其 余 的 全 部 通过 .这些 数据 的 Phi 系数 为 
0. 32. 开 私家 车 到 校 与 考试 合格 间 是 否 有 显著 的 关系 ? 用 双边 检验 . 

选取 20 封 邮件 用 来 测试 写 上 邮政 编码 的 邮件 是 否 比 没有 邮政 编码 的 邮件 更 早 到 达 目 的 
Bb. 将 信 配 成 10 对， 给 每 对 邮件 写 上 相同 的 地 址 并 在 同一 时 间 邮 寄 ， 但 一 封 邮 件 有 邮 
编 ， 另 一 封 邮件 没有 ， 并 将 它们 发 到 全 美 10 大 城市 去 ， 结 果 如 下 : 


有 邮政 编码 没有 邮政 编码 


亚特兰大 3 天 4 天 
巴尔 的 摩 3 天 4 天 
芝加哥 4 天 4 天 
底特律 4 天 5 天 
艾 尔 金 3K 5 天 
费城 5 天 4 天 
加 里 3 天 3 天 
哈 特 福 德 5 天 > 天 
印第安 纳 波 利 斯 4 天 5 天 
洛杉矶 3 天 4 天 


(a) 用 一 种 假设 检验 方法 检验 : 有 邮编 的 邮件 比 没有 邮编 的 邮件 更 早 到 达 目 的 地 . 
(b) 求 含 有 邮编 的 邮件 比 没有 邮编 的 邮件 早 到 概率 的 95% 置信 区 间 . 
(c) 检验 假设 : 含有 邮编 的 邮件 到 达 目 的 地 的 时 间 的 上 四 分 位 数 是 3 天 ， 单 边 备 择 假设 
为 : 含有 邮编 的 邮件 到 达 目 的 地 的 时 间 的 上 四 分 位 数 超过 3 X. 
从 国内 和 国外 申请 管理 学 博士 学 位 的 学 生 总 体 中 分 别 随 机 选取 8 名 学 生 ， 用 来 检验 国外 学 
生 是 否 比 国内 的 学 生 GMAT 分 析 考 试 的 分 数 高 ， 他 们 的 分 数 为 〈 百 分 制 ) 
国外 79, 86, 93, 9, 9, 9, 9, 9 
国内 76, 8, 8, 8 89, 9, 94, 9%6 

用 第 3 或 第 4 章 中 的 方法 分 析 这 些 数 据 ， 用 通常 的 技巧 给 出 近似 p- 值 ， 同 时 求 出 精确 的 
P- 值 ， 并 比较 这 两 个 值 . 
40 名 学 生 参 加 一 个 标准 测试 ， 获 得 如 下 分 数 〈 假 设 把 这 群 学 生 看 作 随 机 样本 ) 

10 92 90 8 75 6 64 47 

100 92 8 8 73 6 6 4 

9 A6 A 9 8 8 7 6 5 40 

92 9 85 78 70 65 5 38 

92 9 8 75 70 6 4 36 
(a) 以 往 的 上 四 分 位 数 为 85 ， 但 是 老师 怀疑 这 次 成 绩 的 上 四 分 位 数 高 于 85， 进 行 合 适 

的 假设 检验 . 

(b) 求 出 上 四 分 位 数 的 95% 置信 区 间 . 
(c) REZENE: 分 数 为 90 分 以 上 的 概率 等 于 40 分 以 下 的 概率 ; 单 边 备 择 假 设 为 : 分 


24. 


25. 


夫妇 


Adams 
Baker 
Chase 
Dodge 
Evans 
Forrester 
Graves 
Holland 
Islip 
Jacobs 
Kraft 
Lewis 
Morris 
Noonan 
O'Neil 
Procter 
Quincy 
Reed 
Smith 
Tracy 
Unseld 
Victor 
Williams 
Young 
Zyskind 


州 内 


数 为 90 分 以 上 的 概率 大 于 40 分 以 下 的 概率 . 
一 个 心理 学 家 试图 证 明 丈 夫 比 妻 子 更 喜欢 对 方 母亲 的 陪同 ， 而 不 是 自己 母亲 选取 一 些 
夫妇 作为 随机 样本 ， 数 据 如 下 : 


丈夫 的 喜好 


对 方 母亲 
对 方 母亲 
对 方 母亲 
母亲 

对 方 母亲 
对 方 母亲 
母亲 


请 使 用 合适 的 假设 检验 来 分 析 这 个 数据 . 
某 便利 店 的 经 理 相信 外 州 的 顾客 〈 从 车 牌号 能 看 出 ) 更 喜欢 使 用 信用 卡 购买 物品 ， 他 记 
录 下 一 个 下 午 所 有 顾客 的 付 账 方式 ， 结 果 如 下 : 


卡 
14 


经 理 的 想法 正确 吗 ? 这 是 哪 种 类 型 的 列 联 表 ? 


6 
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妻子 的 喜好 


267 


269 


导 = 

前 几 章 中 介绍 的 大 部 分 统计 方法 都 可 以 用 于 有 名 义 尺度 的 数据 ,第 3 章 提 出 了 
几 种 分 析 自 然 对 分 数据 的 方法 ， 即 这 些 数 据 是 0-1 型 或 成 功 一 失败 型 数据 ， 第 4 章 的 
讨论 集中 在 分 析 根 据 两 个 或 更 多 不 同 标准 分 类 的 数据 ， 且 根据 每 个 标准 数据 分 成 两 
个 或 更 多 的 类 . 所 有 这 些 方法 可 以 用 于 信息 多 于 可 利用 的 名 义 型 信息 的 数据 ， 但 是 ， 
由 于 各 种 原因 ， 诸 如 要 求 计算 的 速度 和 方便 ， 数 据 比 较 宛 余 ， 或 者 要 求 对 数据 有 特 
殊 的 解释 等 ， 人 们 忽视 了 数据 的 一 些 信息 ， 从 而 将 数据 简化 为 名 义 型 数据 来 分 析 . 
这 种 信息 的 损失 经 常 导致 相 应 功效 的 损失 .本 章 给 出 了 几 种 统计 方法 ， 如 果 数 据 至 
少 具 有 次 序 尺度 ， 则 这 些 方法 会 利用 包含 在 数据 中 的 更 多 信息 . 

数据 可 能 是 非 数 值 的 (“好 ， 更 好 ， 最 好 ”) 或 数值 的 〈7. 36 ,4. 91 ， 等 等 )。 如 
果 数 据 是 非 数 值 的 ， 但 是 依次 序 型 数据 排序 ， 那 么 ， 本 章 的 方法 通常 是 有 用 方法 中 
最 有 功效 的 ， 如 果 数 据 是 数值 型 的 ， 而 且 是 满足 通常 参数 检验 所 有 假定 条 件 的 正 态 
分 布 随机 变量 的 观测 值 ， 用 本 章 的 方法 所 导致 的 效率 损失 将 会 非常 小 .在 那些 情形 
下 ， 只 用 观测 值 的 秩 做 检验 的 相对 效率 经 常 是 0. 95 ， 这 要 视 情 形 而 定 . 

本 章 的 秩 检验 对 各 种 类 型 的 总 体 都 有 效 ， 不 论 是 连续 型 的 ， 离 散 型 的 ， 还 是 二 
者 的 混合 ， 早 期 非 参 数 统计 中 的 结果 为 了 使 基于 秩 的 检验 有 效 ， 要 求 假设 变量 是 连 
续 型 的 .Conover(1973a) 和 其 他 人 的 研究 结果 表明 ， 连 续 性 的 假设 是 没 必 要 的 ， 可 
以 由 一 个 很 简单 的 假设 P(X=x) <1, Vx 来 代替 .因为 任何 的 试验 者 都 不 愿意 从 完全 
由 单独 一 个 数字 构成 的 总 体 中 抽样 ， 所 以 在 本 章 的 检验 中 我 们 不 会 列 出 这 个 假设 . 

如 果 数 据 是 有 序 的 并 且 有 很 多 结 ( 如 果 两 个 观测 值 相 等 ， 则 称 它 们 为 数据 的 
£h), ， 则 可 以 用 秩 检验 来 分 析 ， 这 里 需要 小 心 的 是 ， 只 有 当 数 据 中 没有 结 时 ， 所 谓 的 
小 样本 “精确 表 ” 才 是 精确 的 ， 否 则 它们 是 近似 的 .对 给 定 结集 的 精确 表 可 以 按照 
没有 结 的 方法 得 到 ， 但 是 这 种 随 结集 而 变化 的 一 系列 精确 表 并 不 实用 .如果 数据 中 
有 大 量 的 结 ， 则 本 书 运 用 大 样本 近似 ， 而 不 用 小 样本 表 . 

按 升序 排列 观测 值 的 一 个 很 方便 的 方法 是 Tukey (1977) 给 出 的 茎 叶 图 方法 ,或 
许 最 简单 的 解释 茎 叶 图 方法 的 方式 就 是 给 出 一 个 例子 .假设 一 个 班级 28 个 学 生 在 一 


次 考试 中 所 得 的 分 数 如 下 : 
74 63 8 6 8 9 75 
9 8 77 8 8 8 
9 8 9 73 74 9 78 
84 90 9 79 8 9 


— w 
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在 这 个 例子 中 ， 每 个 考试 分 数 的 十 位 数 是 茎 ， 有 4 个 不 同 的 茎 : 6,7,8 和 9， 个 位 数 
em. “A, ERUF: 


x NGO 


然后 ， 每 个 叶 写 到 对 应 茎 的 右边 ， 也 就 是 将 第 一 个 分 数 74 写成 4 REET 的 右边 . 


每 个 分 数 都 用 这 种 方式 来 写 ， 结 果 如 下 : 
g] $ 3 3 CZI 3 3 


613 9 
考试 成 绩 的 分 布 图 立刻 呈现 出 来 . 但 是 ， 最 重要 的 目的 是 现在 可 以 很 容易 的 从 小 到 
大 排列 分 数 ， 可 以 根据 这 种 方式 给 观测 值 赋 予 秩 ， 这 种 茎 叶 图 的 方法 可 以 使 得 本 章 
的 方法 变 得 更 容易 使 用 . 


5.1 两 个 独立 样本 


本 节 提出 的 检验 是 人 们 所 熟知 的 Mann-Whitney 检验 和 Wilcoxon 检验 ， 可 能 部 分 
是 由 于 检验 方法 的 直观 性 的 要 求 ， 几 乎 在 同一 时 期 ， 该 检验 的 许多 等 价 形式 以 各 种 
各 样 的 称呼 在 文献 中 出 现 . 

通常 两 样本 情形 是 试验 者 从 可 能 不 同 的 总 体 中 得 到 的 两 个 样本 ,希望 用 一 个 统 
计 检 验 来 判断 两 个 总 体 相同 的 零 假 设 是 否 被 拒绝 ， 也 就 是 试验 者 希望 以 两 个 总 体 的 
随机 样本 为 基础 检验 出 两 个 总 体 间 的 差异 .一 个 等 价 情 形 是 ， 得 到 一 个 随机 样本 ， 
但 它 被 随机 的 分 为 两 个 样本 ， 一 个 样本 得 到 一 种 处 理 ， 另 一 个 样本 得 到 不 同 的 处 理 ， 
例如 ， 在 一 个 医学 试验 中 ， 对 一 组 病人 用 新 的 药物 治疗 ， 对 另 一 组 病人 用 现 有 标准 
的 药物 治疗 或 根本 不 用 药物 ， 分 析 这 种 类 型 的 两 样本 试验 和 第 一 种 类 型 的 一 样 

如 果 样 本 是 由 有 序 型 数据 组 成 的 ， 则 对 两 样本 的 差异 最 感 兴趣 的 是 两 个 总 体位 
置 的 差异 .如 一 个 总 体 的 取 值 趋向 于 比 另 一 个 总 体 的 取 值 趋向 大 吗 ? 两 个 中 位 数 相 
等 吗 ? 两 个 均值 相等 吗 ? 

对 于 两 样本 问题 ， 一 个 直观 的 方法 是 将 两 个 样本 组 合成 一 个 有 序 的 样本 ， 不 管 
每 个 值 是 来 自 哪 个 总 体 ， 从 小 到 大 给 样本 值 赋 秩 .这 样 ， 检 验 统计 量 就 可 能 是 那些 
来 自 其 中 一 个 总 体 观测 值 的 秩 和 . 如果 这 个 和 太 小 (或 者 太 大 ) ， 就 意味 着 来 自 这 个 
总 体 的 值 趋向 于 比 来 自 另 一 总 体 的 值 小 (或 者 大 ,根据 具体 情况 而 定 )， 因 此， 如 来 
与 一 个 样本 相关 的 秩 趋向 于 比 与 另 一 个 样本 相关 的 秩 大 ， 则 两 个 总 体 没 有 差异 的 零 
假设 可 能 被 拒绝 . 

对 于 实际 数据 人 们 更 喜欢 考虑 秩 ， 可 能 有 如 下 原因 首先， 如 果 赋 给 观测 值 的 
数字 本 身 没 有 意义 ， 但 只 是 与 其 他 观测 进行 有 序 比较 后 才 有 意义 ， 那 么 这 些 数 字 没 


195 第 5 章 # 检 x 


有 秩 所 含 的 信息 多 ;有 序 的 数据 自然 也 一 样 . 第 二 ， 即 使 这 些 数 字 有 意义 而 分 布 函 
数 并 不 是 正 态 分 布 函数 ， 当 检验 统计 量 是 基于 实际 数据 时 ， 概 率 理论 通常 也 超出 了 
我 们 能 达到 的 范畴 .基于 秩 的 统计 量 的 概率 理论 相对 比较 简单 ， 而 且 在 很 多 情形 下 
并 不 依赖 于 分 布 ， 更 喜欢 秩 的 第 三 个 原因 是 ， 与 通常 参数 检验 类 似 的 两 样本 上 检验 相 
EEH}, Mann-Whitney 检验 的 渐 近 相对 效率 (A. R. E.) 从 来 不 会 太 坏 . 但 反 过 来 并 不 
成 立 ; 与 Mann-Whitney RHEE, t 检验 的 A. R. E. 可 能 和 0 一 样 小 ， 或 者 “无 限 的 
W”. FWL Mann-Whitney 检验 更 安全 . 


PMann-Whitney 检验 


数据 ”数据 由 两 个 随机 样本 组 成 ， 记 X, ,X,,…,X, 为 来 自 总 体 1、 容 量 为 n 的 随机 样本 ， 
记 Y, ,Y,,…,Y, 为 来 自 总 体 2、 容 量 为 m 的 随机 样本 ， 给 这 n+m 个 观测 从 小 到 大 赋予 
秩 ， 记 R(X,) 和 R(Y,) 分 别 为 赋 给 XX, fl Y,( Vi,j) 的 秩 .， 为 方便 起 见 , 令 N=n+m. 

如 果 几 个 样本 值 完 全 相等 ( 结 ) ， 则 给 每 个 值 赋予 秩 是 在 没有 结 时 它们 该 有 秩 的 
平均 ( 见 例 5.1.1). 
假定 条 件 

1. 两 个 样本 都 是 来 自 于 各 自 总 体 的 随机 样本 

2. 除了 每 个 样本 内 观测 相互 独立 外 ， 两 个 样本 之 间 也 相互 独立 

3. 度量 尺度 至 少 是 须 序 的 
检验 统计 量 ”如 果 没 有 结 ， 或 者 结 很 少 ， 赋 给 来 自 总 体 1 的 样本 秩 和 可 以 用 作 检 验 
统计 量 . 


T= Z RX) (1) 
如 果 有 很 多 结 ， 用 了 减 去 均值 再 除 以 标准 差 就 得 到 
Ran 
z 2 
aeea nm(N + 1) (2) 
2 Re = 
N(N — 1) 4(N — 1) 


Eh, XREBCAN EB EO Ki 3CERHI2IB8J N 个 秩 (或 平均 秩 ) 的 平方 和 . 
零 分 布 4 n<20, m<20 时， 所 选 的 了 的 零 分 布 的 下 分 位 数 在 表 A7 中 给 出 . 了 的 
上 分 位 数 w, 由 下 面 关系 式 得 到 
w, = n(n + m + 1) — wi-p (3) 
此 处 ， 下 分 位 数 w, HK A7 获得 . 
作为 用 上 分 位 数 的 备 择 ， 如 下 定义 统计 量 T: 
T' =n(N +1) — T (4) 
如 果 需 要 右边 检验 ， 它 就 可 以 和 下 分 位 数 一 起 运用 .用 环比 从 (3) 式 求 上 分 位 数 和 
右边 p- 值 更 方便 . 
只 有 当 数 据 中 没有 结 时 ， 表 A7 中 的 分 位 数 才 是 精确 的 ， 从 而 没有 用 到 平均 秩 . 
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在 没有 结 且 nn 或 m 大 于 20 的 情况 下 ， 近 似 的 分 位 数 可 由 正 态 通 近 得 到 ， 


(N +1) [nm(N + 1) 
Wp = 2 sa Zp 12 (5) 


其 中 ， 分 位 数 z, 可 由 表 Al 获得 . 

如 果 数 据 中 有 很 多 结 ， 就 用 T 代替 T, T, 是 近似 服从 标准 正 态 的 随机 变量 ， 它 
的 分 位 数 由 表 Al 给 出 . 
假设 
A. (双边 检验 ) 
£ F(x) 和 G(x) 分 别 为 X 和 YY 的 分 布 函 数 ， 则 假设 可 表述 如 下 : 

Ho: F(x) = G(x) ”对 于 任意 x 

H: F(x) # G(x) 对 某 些 x 
检验 对 已 E(X) 关 E( Y) 是 敏感 的 ， 而 且 可 以 用 作 检 验 均 值 ， 在 很 多 实际 情况 中 ， 分 
布 间 的 差异 表明 P(X > Y) 不 再 等 于 1/2， 因 此 经 常用 有 :P(X>Y) 关 P(X<Y) 代 圭 
上 边 的 假设 . 

如 果 T 小 于 它 的 a/2 分 位 数 或 大 于 它 的 1 - a/2 分 位 数 ， 则 以 显著 性 水 平 a 拒绝 
H,,n<20,m=<20, 时 ， 分 位 数 可 以 从 表 A7 和 (3) 式 得 到 ， 对 于 大 样本 逼近 ， 分 位 
数 可 以 从 表 Al 和 (5) REA. WRAT 代替 T， 则 分 位 数 可 以 直接 从 表 Al 得 到 . 

近似 双边 p- 值 可 以 在 表 Al 中 找到 .对 于 T， 将 了 或 了 中 较 小 者 用 在 下 式 中 


| emsa] 
六 值 = 2- P| z<—— M (6) 
Inm(N + 1) 
12 
其 中 ，Z 是 标准 正 态 随机 变量 . 对 于 T,，p- 值 是 2 倍 的 P(Z<T,) sk P( Z>T,) PE 
小 者 . 
B.，( 左 边 检 验 ) 
零 假设 是 : 


Ho: F(x) = G(x} 
而 左边 检验 的 备 择 假设 可 以 用 下 边 形式 中 的 一 个 
Hi: F(x) > G(x) 
Hi: E(X) < E(Y) 
或 
Hi: P(X > Y) < P(X < Y) 
全 部 都 以 不 同 的 方式 传达 这 样 的 思想 ,，“X 趋向 于 比 Y 小”. 
当 n<20,，m<<20 it, WR TFE A7 给 出 的 a 分 位 数 ， 则 拒绝 H; 当 样 本 量 
更 大 时 ， 如 果 T 小 于 (5) 式 给 出 的 a 分 位 数 ， 则 拒绝 H. WRAT, MA T, < z, 
时 ， 以 水 平 a 拒绝 H,， 这 里 z, 从 表 Al 得 到 . 
P- 值 可 由 下 面 的 概率 近似 : 


N 


l W #Ful 3 # A mw 


r+ - 82 
P- 值 = P | z< ———— (7) 


lnm(N + 1) 
12 


这 可 从 表 Al 得 到 ， 对 于 T,，p- 值 近似 于 PP (Z<T,)， 可 直接 从 表 Al 得 到 . 
C. (右边 检验 ) 
零 假设 是 :; 
Ho: F(x) = G(x) 
右边 检验 的 备 择 假设 可 以 用 下 面 形式 中 的 一 个 
Hi: F(x) < G(x) 
Hı: E(X) > E(Y) 
或 
Hı: P(X > Y) > P(X < Y) 
H, 的 3 种 形式 都 以 不 同 的 方式 传达 这 样 的 思想 ,，“X 趋向 于 比 Y 大”. 
如 果 T 大 于 它 的 1 -a 分 位 数 ， 则 以 水 平 a 拒绝 有 ,分 位 数 可 从 表 A7 和 (3) 
式 得 到 ， 我 们 很 容易 发 现 T'=n(N+1) -T, 且 若 T' 小 于 表 AT 中 所 给 的 a 分 位 数 ， 
则 拒绝 Hu， 如 果 n >20 或 m>20， 则 用 (5) 式 来 找 分 位 数 . 
WRAT, WE T, > z, _。 就 拒绝 H, ZAR Al 得 到 . 


pP- 值 近似 于 下 面 的 概率 
pal Nl 
ere | (8) 


它 可 从 表 Al 得 到 ， 并且 与 下 面 的 公式 相同 


p- 值 圭 P [ < (9) 


— 2 “< 
jam(N +1) 
12 
如 果 利 用 T,， 则 产值 可 简单 地 写成 : 


p- 值 = P(Z >T) =1- P(Z <T/) (10) 
它 可 直接 从 表 Al 获得 . 
计算 机 辅助 ”含有 Mann-Whitney 检验 的 计算 机 程序 在 Minitab ,S-plus , SAS 和 StatXact 
中 都 可 找到 . < 
评注 “ 当 检 验 上 述 包 含 P(X> Y) 的 假设 时 ，Mann-Whitney 检验 是 无 偏 的 和 相合 
的 ， 然 而 ， 对 于 包含 E(X) 和 E(Y) 的 假设 却 不 总 是 这 样 的 .为 保证 对 含有 E(X) 
的 假设 其 检验 仍然 相合 且 无 偏 ， 只 要 对 前 面 的 模型 加 入 另 一 个 假定 即 可 . 

假定 4， 如 果 总 体 分 布 函 数 之 间 有 差异 ， 而 这 种 差异 只 是 分 布 位 置 的 差异 .， 即 如 
果 F(x) 和 G(x) 不 等 则 F(x) 和 G(x+c) 相 等 ,其 中 c 是 某 常 数 


例 5.1.1 


某 高 中 四 年 级 有 48 个 男生 . 
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12 个 男生 住 在 农场 ， 其 余 36 个 住 在 城镇 .设计 一 个 检 


验 ， 看 是 否 来 自 农 场 的 男生 比 来 自 城镇 的 男生 健壮 ， 对 这 个 班 的 每 个 男生 做 身体 健 
壮 测试 ， 低 分 说 明 身 体 条 件 差 . 农场 男生 (X,) 和 城镇 男生 ( Y,) 的 得 分 如 下 . 


4.2 


10.6 12.7 16.9 
12.5 14.2 7.9 
12.9 12.6 16.0 
16.1 2.1 10.6 
11.4 17.7 5.6 

2.7 11.8 5.6 


Y: 38 4k 3 * 
7.6 2.4 
11.3 6.4 
8.3 9.1 
6.7 6.7 
36 186 
1.0 3.2 


9.9 
10.6 
14.8 

5.0 

2.6 

4.0 


每 组 男生 都 不 是 来 自任 何 总 体 的 随机 样本 ， 然而， 合理 的 假定 这 些 得 分 是 来 目 此 年 
龄 组 农场 和 城镇 男生 总 体 的 组 合 随机 样本 ， 至 少 对 类 似 的 局 部 而 言 是 这 样 ， 模 型 其 他 的 
假设 似乎 都 是 合理 的 ， 例 如 两 组 之 间 的 独立 性 ， 因 此， 选择 Mann-Whitney 检验 来 检验 
Ho: 农场 男生 不 比 城镇 男生 更 健壮 
Hi: 农场 男生 比 城镇 男生 更 健壮 


这 些 假设 建议 用 假设 检验 C 所 述 的 右边 检验 . 


X Y 


2.7 


4.2 


5.6 


A4 组 得 分 存在 结 
平均 ， 并 把 平均 秩 赋 
检验 是 单 边 的 ， 


得 分 的 秩 赋予 如 下 . 
秩 X V 
17 11.3 

18 11.4 

19 11.8 
2] 12.5 : 
20.5 12.6 
22 127 
23 12.9 

24 14.2 
25 14.8 
26 14.8 

27 15.3 
28 16.0 
305] 16.41 
30.5 16.9 
30.5 17.7 
30.5 18.6 


SERGE 2 y 


Cn an 
L 


i 


， 由 方 括号 标明 .正如 注 明 的 那样 ， 在 每 个 组 内 将 应 赋 的 秩 


秩 X Y 
1 6.2 
2 6.3 

3 6.4 
4 6.7 
5 6.7 
6 7.3 

7 7.6 
8 7.9 
9 8.3 
10 9.0 
11 9.1 
13 9.9 
| 10.6 
13 10.6 
15 10.6 
16 10.6 

AR DIE AEL. 


临界 域 对 应 着 大 的 T, 值 . 注意 到 并 没有 很 多 结 


, WAM T 


IÇ T, 是 可 以 接受 的 ， 在 这 个 例子 的 后 面 将 比较 这 两 种 方法 ， 从 表 Al 可 以 得 到 ，a 


=0. 05 的 临界 域 对 应 


BJ T, IË XK T 1. 6449. 
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这 里 ,我 人 有 n=12,m=36， 所 以 ，N =12 + 36 =48， 赋 给 对 的 秩 和 是 ; 
T = R(X) 


i=1 
= 6 + 10 + 13 + 18 + 22 + 26 + 30.5 + 34 + 36 + 39 + 41.5 + 45 = 321 
这 48 个 秩 的 平方 和 是 : 


š R? = 38,016 
i=] 
比 从 1 到 48 (没有 结 ) 秩 的 平方 和 38 ,024 稍微 小 一 点 (用 引 理 1.4.2. )， 现 在 我 们 
计算 T,. 
T=n 


N+1 
2 


N 2 
nm 2 _ nm(N + 1) 
2 Ri 4(N — 1) 


(12)(36) 
(48)(47) 4(47) 
= 0.6431 
不 在 临界 域内 ， 所 以 接受 H,， 我 们 得 出 结论 : 这 些 数 据 并 不 表明 农场 男生 比 城镇 
REEI. M T, =0. 6431 (由 表 Al 得 到 ) 比较 ， 发 现 0.6431 接近 于 0.74 分 
位 数 ， 所 以 以 水 平 a 为 1 -0.74 =0. 26 拒绝 零 假 设 ， 并 且 p- 值 为 0. 26. 
如 果 我 们 忽略 这 几 个 结 ， 并 用 (5) 式 的 大 样本 通 近 ， 就 可 以 得 到 了 的 近似 


0. 95 分 位 数 为 : 


+ 工 + 16449) Vnm(N + 1) 712 


= 294 + (1.6449)(42) 
= 363.1 
这 和 前 面 一 样 接受 Ho. = 
下 一 个 例子 将 解释 没有 明确 定义 随机 变量 的 情形 ， 根 据 直 接 比 较 相 互 之 间 的 硬度 排 
列 料 石 ， 给 每 块 燃 石 赋 一 个 硬度 度量 的 随机 变量 是 可 以 接受 的 ,但 在 这 种 情形 下 并 
不 必要 
例 5. 1. 2 
设计 了 一 个 简单 的 试验 ,看 A 区 的 糙 石 硬度 是 否 与 B 区 的 炮 石 硬度 相同 ,在 A 区 收 
集 了 4 块 料 石 ,在 B 区 收集 了 5 HEA. WERKE PERE, HAREA 
互相 摩擦 ， 破 损 少 的 那 块 被 判定 是 两 块 中 更 硬 的 .用 这 种 方式 将 9 块 煤 石 按 硬度 排 


_ N 
Wo95 三 H 


序 ， 秩 1 赋 给 最 软 的 一 块 ， 秩 2 赋 给 次 最 软 的 ， 等 等 


FLAG A A A B A B B B B 
秩 T 2 3 45 ë 9? Ë 9 


5.1 两 个 独立 样本 201 


要 检验 的 假设 是 : 
Ho: A 区 和 B 区 的 燃 石 硬度 相同 
备 择 假 设 是 : 
Hi: 燃 石 硬度 不 相同 
用 Mann-Whitney 双边 检验 ， 其 中 , n=4, m=5, H 
T=A 区 石 块 的 秩 和 
=1+2+3+5 
=11 
近似 0.05 的 双边 临界 域 对 应 着 了 值 小 于 12 和 7T 值 大 于 (4)(10) -12 =28. 由 于 在 
这 个 例子 中 T 小 于 12， 零 假设 被 拒绝 ， 得 出 结论 是 两 个 区 的 燃 石 硬度 不 相同 .由 于 
趋势 的 不 同 ， 进 一 步 的 结论 是 B KRAE A KAA EBE. p- 值 可 以 近似 地 从 


(6) 式 和 表 Al 得 到 . 
1 10 
i S> 2 
p- = 2 : [e ia 


4-5-10 
12 
=2 . P(Z< —2.0821) 
= 2(0.019) = 0.038 m 
口 理论 ”假设 X 和 Y 是 同 分 布 的 ， 可 以 找到 了 的 零 分 布 ， 如 果 X A Y, 独立 同 分 布 ， 
则 在 组 合 的 样本 中 , X 和 YY 的 每 个 排列 都 是 等 可 能 的 ， 这 是 很 多 秩 检验 所 依赖 的 基 
本 原则 ， 对 这 个 陈述 的 证 明 需 要 微 积分 学 ， 因 此 超出 了 本 书 的 范围 ， 然 而 ， 当 人 们 
试图 提供 一 个 理由 说 明 一 些 排 列 比 其 他 的 更 可 能 后 ， 这 一 陈述 的 真实 性 看 起 来 显得 
比较 直观 ， 对 此 没有 更 有 效 的 理由 了 . 因此 ， 作 为 直观 明显 而 未 证 明 的 陈述 ， 我们 
这 里 可 以 接受 这 个 事实 ， 即 所 有 有 序 的 排列 是 等 可 能 的 . 
如 果 X 和 Y; 是 独立 同 分 布 的 ， 则 在 这 个 组 合 的 样本 中 赋 给 X, 的 秩 应 该 与 从 
1 到 n+m 整数 中 随机 选择 n 个 整数 类 似 ， 即 没有 理由 说 明 为 什么 赋 给 X; 一 个 值 某 
个 指定 秩 的 机 会 比 赋 给 它 其 他 任何 秩 的 机 会 大 ， 由 于 1 ntm 中 的 每 个 数 是 等 可 
能 地 赋 给 X 作 秩 的 ， 由 于 个 不 同 的 数 选 为 X 的 秩 ， 秩 和 7 了 的 概率 分 布 可 以 通过 
考虑 无 放 回 地 从 1 到 n+m 个 整数 中 随机 选取 n 个 整数 和 的 概率 分 布 得 到 . 


十 
从 +m 个 整数 中 计 取 个 整数 的 方式 总 共有 | "En, mamana a 
H 
前 提 ， 每 种 方式 出 现 的 概率 相同 ， 因 此 ， 通 过 计算 从 1 #] n + m 中 取 不 同 的 n 个 整数 
n +m 
且 和 为 的 个 数 ， 再 用 这 个 数 除 以 J B T= k ARER 
n 


例如 ， 在 例 5.1.2 中 ， 如 果 样 本 大 小 n=4,m=5， 从 9 个 秩 中 选 出 4 个 ， 不 同方 
式 的 个 数 为 
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n+m\_ 9 _ 
( n )- 28 = 126 


当 1,2,3,4 这 4 个 秩 被 选 到 时 ，7 的 最 小 值 可 能 是 10， 仅 当 1,2,3 ,5 被 选 到 时 , 7 的 
下 一 个 值 是 1. T=12 有 两 种 方式 ， 即 秩 为 1,2,3 ,6 时 或 秩 为 1,2,4,5 时 ， 因 此 
P(T = 10) = 17126 P(T < 10) = 0.0079 
P(T = 11) = 1/126 P(T < 11) = 0.0159 
P(T = 12) = 2/126 P(T < 12) = 0.0317 
等 等 


注意 ， 在 例 5. 1.2 中 精确 的 p- 值 是 2. P(T<11), 这 已 经 由 上 面 给 出 ， 是 4/126 = 


0.0317， 与 这 个 例子 中 用 的 近似 p- 值 0.038 差距 不 大 . 


w 


由 于 T 是 nn 个 X 的 秩 和 ， 对 于 大 的 n 和 mm， 可 以 用 中 心 极 限定 理 来 得 到 了 的 渐 
近 分 布 ， 这 已 在 例 1.5.7 中 完成 ， 其 结果 表明 了 是 渐 近 正 态 的 ， 它 的 均值 和 方差 
(由 定理 1.4.5 给 出 ) : 


_ n(n + m + 1) 
E(T) = > (11) 
和 
_ n(n + m + Lm 
Var (T) = y (12) 
因此 ， 根 据 定理 1.$.1， 7 的 分 位 数 近 似 为 
Wp = E(T) + zp V Var (T) (13) 


其 中 ，z, 是 标准 正 态 分 布 的 p 分 位 数 ， 除 了 Var( T) 必须 基于 两 个 样本 中 所 用 的 真实 
秩 和 平均 秩 外 ， 用 正 态 逼近 T, 的 理由 和 前 面 用 正 态 通 近 了 的 理由 相似 ,细节 的 讨论 
放 在 5.3 节 ， 口 

Mann-Whitney 检验 可 以 用 于 检验 

Ho:E(X)=E(Y)+d, 或 E(X)—-E(Y)=d (14) 

这 里 d 是 某 个 指定 的 数 ， 我 们 简单 地 将 d 加 到 每 个 Y, 上， 然后 将 Mann-Whitney 检验 
用 到 原始 X 和 新 调整 的 Y 上 . 

导致 接受 上 述 H, 的 所 有 d 值 的 集合 ， 就 是 我 们 所 得 到 的 两 个 期 望 差异 E(X) -E 
(Y) 的 置信 区 间 ， 对 试验 者 来 说 ， 这 个 置信 区 间 比 仅 检 验 两 个 期 望 是 否 相 等 更 有 意义 , 
我 们 现在 来 介绍 获得 置信 区 间 的 一 种 方法 ， 而 不 必 一 再 运用 Mann-Whitney 检验 . 


> 两 个 期 望 差异 的 置信 区 间 


数据 ”数据 分 别 由 样本 大 小 为 n 和 m 的 两 个 随机 样本 XX, ,…,X, 和 Y, Yn 组 成 . 
S XAYDI X, A Y, 同 分 布 的 随机 变量 
假定 条 件 

1. 两 个 样本 都 是 来 自 各 自 总 体 的 随机 样本 . 

2. 除了 每 个 样本 内 观测 相互 独立 外 ， 两 个 样本 之 间 也 相互 独立 . 

3. 除了 位 置 参 数 可 能 不 同 外 ， 两 个 总 体 的 分 布 函 数 相同 ， 即 有 一 个 常数 4， 使 
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得 X 和 Y+d 有 相同 的 分 布 函 数 . 

注意 ， 这 里 不 需要 假设 连续 性 ，Noether(1967b ) 证 明 如 果 从 连续 总 体 抽 样 时 ， 置 信 
区 间 的 置信 系数 是 1 -a， 则 对 于 一 般 的 总 体 ， 同样 的 置信 区 间 包 括 端 点 时 ， 置 信 系数 
至 少 是 1 -a， 而 不 包括 端点 时 至 多 是 1 - a， 我 们 这 里 将 包含 端点 . 
方法 ”对 固定 的 n 和 m， 用 表 A7 来 确定 a/2 分 位 数 w。,; 如 果 n 和 m 很 大 时 ， 则 用 
(5) 式 来 确定 ， 这 里 (1 -a) 是 理想 的 置信 系数 注意， 在 有 很 多 结存 在 时 ， 表 A7 
和 (5) 式 也 适用 .然后 用 下 式 计算 k 

k = Wa;2 — n(n + 1) /2 (15) 

从 所 有 可 能 的 数 对 (X,Y,) 中 找 出 k 个 最 大 的 X,- Y, A k ARDHI X, -Y 2 í 1 
出 最 大 差异 和 最 小 差异 ， 先 将 每 个 样本 从 小 到 大 排序 是 很 方便 的 ， 然 后 用 的 数据 
作 行 ，Y 的 数据 作 列 ， 形 成 差异 X - Y, 的 矩阵 ， 第 k 个 最 大 的 差异 是 上 限 U, 第 k 个 
最 小 的 差异 是 下 限 L， 即 ， 对 所 有 mn 个 可 能 差异 的 有 序 排列 ， 分 别 从 排列 的 左右 两 
边 向 中 间 数 ， 则 相应 的 第 个 差异 就 是 L 和 U， 然 后 得 到 置信 区 间 


PILS E(X) - E(Y)< UI>1-a (16) 
计算 机 辅助 ”两 个 期 望 (或 中 位 数 ) 之 差异 的 精确 非 参 数 置 信 区 间 可 以 从 Minitab 和 
StatXact 中 得 到 这些 也 是 众所周知 的 位 移 Hodges-Lehmann fiih. ——— 


例 5. 1.3 
蛋糕 糊 达到 一 定 的 稠度 将 要 被 搅拌 . 5 批 糊 状 物 将 用 搅拌 器 A 来 搅拌 ， 另 外 5 批 用 
搅拌 器 B 来 搅拌 .搅拌 的 时 间 由 下 表 给 出 (分钟 ). 

搅拌 器 A 73 69 72 78 72 

搅拌 器 B 74 68 69 67 71 
要 求 搅拌 时 间 均 值 之 差 的 95% 置信 区 间 ， 具 体 地 说 是 E(X) - E( Y) K 95% 置信 区 
间 ， 这 里 是 指 搅 拌 器 A 的 时 间 ，Y 是 指 搅拌 器 B 的 时 间 . 

对 于 n=5,m=5,a=0.05， 从 表 A7 得 到 wo ws =18， 所 以 上 =18-(5)(6)7Z2 = 

3.， 把 两 个 样本 从 小 到 大 排序 ，X 作 行 ，Y 作 列 ， 形 成 差异 X, - Y, 的 矩阵 如 下 . 


7.1 7.4 


; $ i -0.2 -0.5 
0.5 0.4 0.3 0.1 -0.2 
0.5 0.4 0.3 0.1 -0.2 
0.6 0.5 0.4 0.2 -0.1 
7.8 1.1 1.0 0.9 0.7 0.4 


于 是 ， 得 到 最 大 和 最 小 差异 . 


最 小 差异 最 大 差异 
6.9 — 74 = -0.5 78 — 67 = 1.1 
6.9 — 7.1 = —0.2 7.8 — 6.8 = 1.0 


72—74=-02=L 78-69=09=Uu 
所 以 得 到 E(X) - E(Y) 的 95% 置 信 区 间 为 (L,U), BB ( -0.2,0.9). 图 


282 
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口 理论 ”注意 ,有 mn 个 对 (X,Y)， 记 为 X,>Y， 即 X,Y >0 数据 对 的 个 数 ， 则 
(1) RPH TOX 的 秩 和 ) 是 kt+n(n+1)/2 ( 见 思考 题 1). 因为 如 果 没 有 一 个 Y 比 
X 小 , 则 T=1+2+…+n= n(n+1)/2 (根据 引 理 1.4.1), 而 有 kk 对 (X,Y,) 使 得 
Y 比 X 小 的 影响 是 T 增 大 了 个 单位 . 

使 得 H, 刚好 接受 的 TT 的 “边界 ” 值 在 表 A7 中 以 wi 给 出 ， 从 wa PRAE 
n(n+1)/2， 我 们 就 得 到 上 的 边界 值 ， 现 在 我 们 要 求 4 的 值 使 得 它 加 给 Y 后 刚好 能 
得 到 kk 的 边界 值 ， 即 使 得 恰好 有 上 个 数 对 (X,,Y +d)， WE X, > Y, +d XX, - Y; >d. 

如 果 我 们 将 所 有 差异 X, - Y, 中 的 最 大 值 加 到 每 个 Y 上 ， 显 然 没 有 一 个 XX 会 比 调 
整 的 Y 大， 因为 这 些 Y 太 大 了 . 将 差异 X,Y, 中 的 第 k 个 大 值 加 到 每 个 Y 上 ， 我 们 
将 得 到 边界 情况 : WE X >Y, +d 的 数 对 不 到 个， 满足 X, 宇 Y; +d WREDA k 
个 ， 我 们 由 此 得 到 d 的 最 大 值 ， 它 使 得 能 接受 刁 :E(X) =E(Y) +d. 将 上 述 过 程 从 左 
端 开始 再 做 一 遍 ， 我 们 得 到 4 的 最 小 值 ， 它 使 得 能 接受 相同 的 假设 .这样 4 值 的 集合 
给 出 了 我 们 所 求 的 置信 区 间 . 口 


与 其 他 方法 比较 


tj Mann-Whitney 检验 相 比 的 自然 方法 ， 就 是 早 些 提 到 的 两 样本 上 检验， 这 种 : 


检验 的 形式 将 两 样本 的 样本 均值 x 和 YY 包含 在 下 面 的 公式 中 . 
_ _ (X — Y)Vmn(N — 2)/N 


> (X, — X) + > (Y; — YY 
Js j= 


1 值 要 与 自由 度 为 N -2 的 + 分布 的 分 位 数 (由 表 A21 获得 ) 比较 .为 了 使 这 些 分 位 
数 比 较 精确 ， 必 须 另外 假设 两 个 总 体 都 是 正 态 分 布 ， 有 了 这 个 假设 ， t 检验 是 最 强 功 
效 的 检验 ， 当 + 检验 与 Mann-Whitney 检验 相 比 时 ， 一 些 非 正 态 型 分 布 会 导致 检验 有 
很 小 的 功效 ， 特 别 是 当 一 个 或 两 个 样本 中 都 有 异常 的 大 或 小 的 观测 〈 称 为 “ 离 群 
fa”) 时 ， 是 这 样 . 

如 果 1 统 计量 的 计算 机 程序 是 可 行 的 ， 则 它 可 以 用 来 简化 Mann-Whitney 检验 中 
的 计算 ,尤其 是 有 很 多 结 时 ， 因 为 仅 要 计算 基于 秩 R(X,) 和 R(Y,) 而 不 是 X, 和 YY 的 
f 统 计量 ， 用 这 个 结果 与 自由 度 为 Y-2 的 + 分 布 的 分 位 数 〈 可 由 表 A21 获得 ) 做 比 
较 ， 尽 管 这 个 通 近 和 通常 的 正 态 允 近 不 尽 相 同 ， 但 它 在 大 多 数 情 况 下 更 精确 ， 对 于 
一 个 甚至 更 好 的 允 近 来 说 , 求 由 (2) 式 给 出 的 T, 的 平均 值 ， 计 算 基于 秩 的 1 统计 
量 ， 并 将 它 与 从 表 Al 和 表 A21 得 到 的 两 个 分 位 数 的 平均 做 比较 .这 个 方法 更 多 的 细 
节 可 参看 Iman( 1976). 

在 假设 X 和 Y 的 分 布 除了 它们 的 均值 外 是 相同 的 前 提 下 ,我 们 考虑 Mann- Whit- 
ney 检 验 与 :检验 相 比 的 渐 近 相对 效率 (A. R. E. ) . 如 果 总 体 是 正 态 的 , 则 A. R. E. 
是 0.955 ;如 果 总 体 是 均匀 的 , 则 A. R. E. 是 1. 0 ; 如果 总 体 是 对 称 的 双 指 数 分 布 ， 
则 A. R. E. 是 1. 5 , 如果 两 个 总 体 只 是 位 置 参 数 不 同 , 则 A. R. E. 不 会 小 于 0. 864, 


t (17) 
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但 是 可 能 会 达到 无 穷 大 (Hodges 和 Lehmann，1956). 

中 位 数 检验 也 可 以 用 于 这 种 类 型 的 数据 .Mann-Whitney 检验 相对 于 中 位 数 检验 
的 A.R. E. 而 言 ， 对 于 正 态 分 布 是 1.5， 对 于 均匀 分 布 是 3.0, 但 对 于 双 指 数 分 布 只 
有 0. 75， 记 住 这 是 渐 近 (asymptotic) 相对 效率 ， 对 于 小 样本 ，Mann-Whitney 检验 在 
双 指 数 分 布 中 可 能 比 中 位 数 检 验 中 的 功效 更 高 ( 见 Conover, Wehmanen 和 Ramsey , 
1978)， 另 一 方面 ， 当 H, 为 真 时 ， 中 位 数 检 验 并 不 要 求 分 布 相同 ， 它 只 要 求 它 们 有 
相同 的 中 位 数 . 因此 中 位 数 检验 可 以 用 到 Mann-Whitney 检验 无 效 的 情形 中 . 

Mann-Whitney 检验 首先 是 由 Wilcoxon(1945 ) 在 n=m 的 情形 下 介绍 的 . Wilcox- 
on 检验 由 White(1952 ) 和 van der Reyden(1952) 推 广 到 样本 大 小 不 等 的 情形 . Festing- 
er(1946) 独 立 发 展 和 介绍 了 与 Wilcoxon 的 检验 等 价 的 形式 ，Mann 和 Whitney 好 像 是 
最 先 考虑 了 样本 大 小 不 等 的 情形 ， 并 提供 了 适合 小 样本 使 用 的 表 . 很 大 程度 上 是 因 
为 Mann 和 Whitney 的 工作 引发 了 这 个 检验 的 广泛 使 用 . 由 于 这 个 检验 归属 于 不 同 的 
作者 ， 叫 它 哪个 名 字 是 使 用 者 的 特权 . 

为 了 检查 散布 或 方差 或 尺度 的 不 同 ，Siegel 和 Tukey 在 1960 年 介绍 了 对 Mann- 
Whitney 检验 所 做 的 修正 ， 它 和 Freund 和 Ansari( 1957) 设 计 的 早 些 的 检验 在 原则 上 是 
相似 的 .这 两 个 检验 之 间 的 关系 在 Hájek 和 Sidák( 1967 ) 的 第 126 页 有 描述 . 

X} F Mann-Whitney 检验 更 广泛 的 表 ，Verdooren(1963 ) 给 出 了 n A m=<25 情形 下 的 
表 ，Milton(1964) 给 出 了 n<20 和 m<40 情形 下 的 表 ， 其 他 表格 和 参考 书 可 以 在 Jacob- 
son( 1963 ) 中 找到 . Klotz(1966 ) 和 Buckle,Kraft 和 van Eeden ( 1969 ) 讨论 过 Mann-Whit- 
ney 检验 统计 量 的 分 布 ， 其 他 参考 文章 可 见 Zaremba( 1965 ) 和 Serfling( 1968). 

Mann-Whitney 和 其 他 密切 相关 检验 的 效率 是 Chanda ( 1963 ) ,Noether( 1963 ) , Hay- 
man 和 Govindarajulu ( 1966 ) , McNeil ( 1967 ) , R. A. Shorack ( 1967 ) , Stone ( 1967 ) 以 及 
Conover 和 Kemp( 1976) 的 文章 的 主题 . Conover(1973a) 给 出 了 结 的 处 理 理 由 Allfing 
(1963), , Woinsky 和 Kurz ( 1969 ) , Bradley , Martin 和 Wilcoxon ( 1965 ) , Bradley , Mer- 
chant , Wilcoxon ( 1966) ,Sen 和 Ghosh( 1974 ) 以 及 Spurrier 和 Hewitt( 1976 ) 给 出 了 后 续 
检验 的 修正 ，Batschelet( 1965 ) 讨论 了 检验 圆 分 布 的 问题 ， 并 由 Beran( 1969 ) 和 Schach 
(1969b) 解决 . 

如 果 两 个 样本 是 删 失 的 〈 即 如 果 一 些 最 大 的 /或 最 小 的 样本 值 是 不 可 观测 的 ) ， 
则 数据 可 以 用 修正 的 Mann-Whitney 检验 来 分 析 ， 正 如 Gastwirth ( 1965a ) , Gehan 
(1965a, 1965b ) ,Gehan 和 Thomas ( 1969 ) , Saw ( 1966 ) , Basu ( 1968 ) , Hettman-sperger 
(1968) 和 Shorack (1968 ) 讨 论 的 那样 ， Mardia( 1967a ,1968 ) 给 出 了 二 维 两 样本 秩 检 
验 问 题 ， 其 他 两 样本 非 参 数 检验 由 Hudimoto( 1959) ,Haga( 1960) ,Tamura( 1963 ) ,Pot- 
thoff ( 1963) , Wheeler 和 Watson ( 1964 ) , Gastwirth ( 1965b ) , Bhattacharyya 和 Johnson 
( 1968 ) , Mielke ( 1972 ) 和 Pettitt ( 1976) 提出 并 讨论 过 Mikulski ( 1963 ) , Basu 
(1967a) , Hollander (1967a) 以 及 Gibbons 和 Gastwirth( 1970) 验证 了 一 些 检验 的 效率 . 
其 他 相关 的 文章 包括 Hollander,Pledger 和 Lin( 1974) , Bickel 和 Lehmann( 1975 ) , Hett- 
mansperger 和 Malin ( 1975 ) , Doksum 和 Sievers ( 1976 ) 以 及 Fligner, Hogg 和 Killeen 
(1976). 
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Noether( 1967a ) 讨论 过 寻找 置信 区 间 的 方法 ，Walker 的 Moses 和 Lev(1953 ) 描述 


过 相关 的 图 方法 . 当 样 本 容量 较 大 时 ，McKean 和 Ryan( 1977 ) 给 出 了 可 能 有 用 的 算 
法 . 其 他 位 置 差异 的 估计 由 Hodges 和 Lehmann ( 1963 ) , Høyland ( 1965 ) , Rao , Schuster 
和 Littell( 1975) 以 及 Switzer( 1976) 讨论 过 .相关 的 文章 还 有 Moses( 1965 ) ,Govindara- 
julu( 1968) ,Bauer(1972) ,Ury(1972) 以 及 Kraft 和 van Eeden(1972). 


习题 


l. 


检验 下 面 的 数据 ， 看 Des Moines 市 的 平均 高 温 是 否 比 Spokane 市 的 平均 高 温 高 ， 数 据 是 
在 夏天 随机 抽样 得 出 的 . 
Des Moines 83 91 94 89 89 96 91 92 90 
Spokane 78 82 81 77 79 81 80 81 
在 一 个 可 控 环 境 实验 室 中 ， 检验 10 位 男士 和 10 位 女士 ， 来 决定 他 们 认为 最 适合 的 室内 温 
度 . 结果 如 下 
男士 74 72 77 76 76 73 75 73 74 75 
女士 75 77 78 79 77 73 78 79 78 80 
假设 这 些 温度 好 似 来 自 各 自 总 体 的 随机 样本 ， 问 男士 和 女士 平均 适合 的 温度 相同 吗 ? 
用 现 有 的 方法 教 7 个 学 生 学 代数 ， 而 6 个 学 生 用 新 方法 来 学 习 代 数 ， 求 用 这 两 种 方法 学 习 
所 得 成 绩 分 数 差异 的 90% 置信 区 间 . 


方法 学 生成 绩 分 数 
现 有 的 68 72 79 69 84 80 78 
新 的 64 60 68 73 72 70 
把 食物 A 给 了 4 个 超重 的 女孩 ， 把 食物 B 给 了 其 余 5 个 超重 的 女孩 ， 所 观测 到 的 减肥 重 


量 如 下 ， 求 出 两 种 食物 平均 效率 差异 的 90% 置信 区 间 . 


食物 减肥 重量 ( 磅 ) 
A 7, 2, —1, 4 
B 6,5,2,8;3 


一 个 试验 中 的 8 名 志愿 者 随机 分 为 两 组 ， 看 望远镜 瞄准 器 是 否 能 提高 微 光 条 件 下 射 中 目标 
的 能 力 ，A 组 给 了 带 有 望远镜 瞄准 器 的 步枪 ，B 组 有 同样 的 步枪 ， 但 带 的 是 开放 式 瞄 准 器 . 
学 习 了 一 段 时 间 后 ， 对 他 们 进行 了 微 光 下 射击 测验 .下面 是 他 们 的 分 数 〈 满 分 100 分 ) 

A 组 96 93 88 85 

B 组 8 8 8 77 
你 能 得 到 什么 结论 ? 
在 一 个 树木 繁茂 的 地 方 建立 起 10 个 普通 伪装 的 帐篷 和 10 个 有 图 案 伪 装 的 帐篷 ， 一 队 观 测 
者 出 发 去 寻找 它们 ， 并 报告 他 们 第 一 眼看 到 每 个 帐篷 的 距离 ( 仅 真 正 看 到 的 ) ， 直 到 所 有 
20 个 帐篷 都 被 找 到 为 止 。 这 个 研究 的 目的 是 确定 有 图 案 伪装 是 否 比 普通 伪装 更 难 发 现 . 


每 个 帐篷 被 发 现 的 距离 如 下 表 
伪装 类 型 距离 ( 米 ) 
普通 的 25, 28, 16, 34, 38, 21, 29, 43, 32, 36 
带 图 案 的 26, 12, 16, 21, 20, 14, 10, 18, 22, 20 
(a) 作 一 个 假设 检验 . 


(b) 求 出 平均 发 现 距 离 差 异 的 95% 非 参数 置信 区 间 . 
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思考 题 


l. 设 5 为 X 大 于 YY 的 (X,Y;) 的 对 数 《〈 结 计数 为 0.5)， 注 意 到 总 共有 mn 对 ， 证 明 S 和 了 
满足 关系 


_ n(n + 1) 
S=T w NSS; 


作为 P(X> Y) 的 估计 ， 哪 个 统计 量 看 起 来 是 合理 的 ? 

2. 在 n=3,m=2，H 为 真 的 情况 下 ， 求 出 T 的 精确 分 布 ， 并 和 表 A7 比较 . 

3. ”计算 习题 2 中 数据 的 两 样本 + 统计 量 ( (17) xÇ), ， 并 把 结果 和 用 Mann-Whitney 检验 得 到 
的 结果 进行 比较 . 


5.2 多 个 独立 样本 


Kruskal 和 Wallis(1952) 把 5.1 节 中 提出 的 两 个 独立 样本 的 Mann-Whitney 检验 推 
广 到 分 析 大 (大 >2) 个 独立 样本 的 问题 ， 试 验 情形 是 大 个 随机 样本 已 经 得 到 ， 且 来 自 K 
个 可 能 不 同 的 总 体 ， 我 们 要 检验 零 假设 : 所 有 总 体 分 布 都 相同 ， 对 备 择 假设 : 有 些 
总 体 提供 比 其 他 总 体 偏 大 的 观测 值 . “ 偏 大 ”是 运用 到 随机 变量 的 观测 值 上 ， 但 实际 
上 ， 这 些 观测 值 可 以 是 根据 一 些 诸如 质量 ， 值 之 类 的 性 质 按 升序 排列 的 任何 观测 值 ， 
它们 可 以 用 Kruskal-Wallis 检验 来 分 析 ， 这 个 分 析 过 程 类 似 于 Mann-Whitney 检验 分 析 
非 数 值 数据 的 方式 ， 正 如 例 5. 1. 2 中 的 那样 . 


> Kruskal-Wallis 检验 


数据 HEHk ERAR 6E AS ARMEER. ie26 i NERAN n 的 随机 
样本 为 Xa Ai est P 则 数据 可 以 排 成 许多 列 . 


样本 1 样本 2 Pane 样本 大 
Xia Xz Xka 
X12 X22 Xk2 
Xin 1 Xan 2 Xen 
i N 为 观测 的 总 数 
k 
N = > ni (1) 
i=] 


给 N 个 观测 值 中 最 小 的 赋 秩 1， 给 第 二 小 的 赋 秩 2， 等 等 ，N 个 观测 中 最 大 的 赋 秩 N. 
A R(X ) 代 表 赋 给 2 的 秩 ， 令 R, 为 赋 给 第 i AREER, B 


n; 
R=Ð R(X;  i=1,2...,k (2) 
j=l 


对 每 个 样本 计算 R.. 
如 果 有 几 个 观测 互相 相等 ， 则 可 能 会 有 不 同 的 方式 赋 秩 ， 像 本 章 前 面 的 检验 中 
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那样 ， 给 每 个 有 结 的 观测 赋 平 均 秩 . 
假定 条 件 
1. 所 有 样本 均 为 来 自 各 自 总 体 的 随机 样本 . 
2. 除了 每 个 样本 内 观测 相互 之 间 独 立 外 ， 每 个 样本 之 间 也 是 相互 独立 的 . 
3. 度量 尺度 至 少 蚌 须 序 的 . 
4. 或 者 k 个 总 体 分 布 函 数 相同 ， 或 者 一 些 总 体 产 生 比 男 一 些 总 体 产 生 大 的 值 . 
检验 统计 量 检验 统计 量 定义 为 


k Rë 2 ü 
T=- 各 D) 3 
其 中 , N #l R, 分 别 在 (1) RA (2) 式 中 定义 ， 
ep y NV+ 
So N 4 ) (4) 
如 果 没 有 结 ， 则 S' 简化 为 WIN+1)Z12， 检 验 统计 量 简化 为 
12 < R 
TONN m NHY (5) 
如 果 结 的 个 数 是 中 等 的 ，(3) RA (5) 式 之 间 差 别 很 小 ， 所 以 我 们 更 愿意 使 用 简化 


的 (5) 式 . 
零 分 布 对 于 k=3 和 所 有 的 n,<5， 表 Ag 给 出 了 了 的 精确 分 布 ， 但 是 一 般 情形 下 ， 精 确 
分 布 相当 难 求 ， 因 此 ， 自 由 度 为 上 -1 的 x DREA T HEA. 
假设 
Bo: 所 有 的 上 个 总 体 分 布 函 数 相同 
Hi: 至 少 有 一 个 总 体会 产生 比 其 他 至 少 一 个 总 体 偏 大 的 观测 
因为 Kruskal-Wallis 检验 的 设计 对 检验 k 个 总 体 之 间 均 值 差 异 是 敏感 的 ， 所 以 备 
择 假设 有 时 也 有 如 下 叙述 . 
Hi:k 个 总 体 没有 相同 的 均值 
如 果 T 大 于 它 零 分 布 的 1 -a 分 位 数 ， 则 以 水 平 a 拒绝 Ho 如 果 k=3， 所 有 的 
样本 容量 为 5 或 更 小 ， 而且 没有 结 ， 则 精确 的 分 位 数 可 以 从 表 A8 中 得 到 . Iman, 
Quade 和 Alexander( 1975) 中 给 出 了 更 广泛 而 精确 的 表 . 当 有 结存 在 时 ， 或 者 当 精 确 
表 不 可 用 时 ， 近 似 的 分 位 数 〈 即 自由 度 为 上 -1 的 分 布 的 分 位 数 ) 可 以 从 表 A2 中 
得 到 ， 如 果 T 大 于 这 样 得 到 的 1 - a 分 位 数 ， 则 以 水 平 a 拒绝 Hu,，p- 值 近似 为 自由 度 
为 k-1 的 x 分 布 随机 变量 超过 了 观测 值 的 概率 . 
多 重 比较 ” 当 且 仅 当 截 假设 被 拒绝 时 ， 我 们 用 下 面 的 方法 决定 总 体 的 哪些 对 不 同 . 
如 果 下 面 的 不 等 式 满足 ， 我 们 可 以 说 总 体 i 和 j 不同: 
Ri _ R; 


a 
rg > H-(a/2) (s RET n A (6) 


其 中 ，R, 和 R, 是 两 个 样本 的 秩 和 ，t,_。s 是 从 表 A21 18 A Ha BE 29 N - k h tA 
的 (1 -a/2) 分 位 数 ，8 由 (4) 式 确 定 , TH G) 式 或 (5) 式 确定 ， 可 对 总 体 
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的 所 有 对 重复 使 用 这 个 方法 ， 正 如 在 Kruskal-Wallis 检验 中 所 用 到 的 a 一样 ， 这 里 所 
用 的 是 同样 的 a 水平 . 
计算 机 辅助 ”含有 Kruskal-Wallis 检验 的 计算 机 程序 在 Minitab , S-Plus , SAS 和 
StatXact 中 都 有 .这 些 和 其 他 程序 都 会 将 数据 转换 为 秩 ， 并 作 秩 的 单 因素 方差 分 析 ， 
正如 思考 题 5 中 所 讨论 的 ， 这 个 方法 自动 修正 结 ， 而 且 包 含 更 宽 可 供 选 择 的 多 重 比 
较 方法 . < 
Hij 5. 2. 1 
数据 来 自 例 4.3.1 给 出 的 完全 随机 化 的 设计 ， 其 中 种 玉米 的 4 种 不 同方 法 导致 了 不 
同 地 块 上 每 亩 产量 的 不 同 ， 通 常 只 用 一 个 统计 分 析 ， 但 是 这 里 我 们 用 Kruskal-Wallis 
检验 ， 使 得 一 个 困难 的 比较 可 以 用 中 位 数 检验 来 处 理 ， 它 先 提供 一 个 比 0.001 稍 小 
一 点 的 p- 值 . 
假设 表述 如 下 : 
Ho: 4 种 方法 等 价 
H): 一些 种 玉米 的 方法 比 其 他 方法 的 产量 更 高 
把 观测 从 最 小 的 77， 秩 为 1， 到 最 大 的 101， 秩 为 N=34 排列 ， 有 结 的 值 赋 平均 秩 . 
观测 的 秩 以 及 秩 和 R, 给 出 如 下 . 


方法 
1 2 3 4 
观测 秩 观测 秩 观测 秩 观测 秩 
83 11 91 23 101 34 78 2 
91 23 90 19.5 100 33 82 9 
94 28.5 81 6.5 91 23 81 6.5 
89 17 83 11 93 27 77 1 
89 17 84 13.5 96 315 79 3 
96 31.5 83 11 95 30 81 6.5 
91 23 88 15 94 28.5 80 4 
92 26 91 23 81 6.5 
90 19.5 89 17 
s 84 13.5 a 
R 196.5 153.0 207.0 38.5 
ni: 9 10 7 8 
N= 34 


近似 大 小 a =0. 05 的 临界 域 对 应 着 大 于 自由 度 为 -1 =3 的 x 分 布 随机 变量 的 
0.95 分 位 数 的 了 值 ， 由 表 A2 可 得 ， 它 为 7.815 (注意 ， 中 位 数 检验 也 用 自由 度 为 
k-1 的 x 分 布 ， 所 以 尽管 检验 统计 量 不 同 ， 这 两 个 检验 的 临界 域 将 会 相同 . ) 


用 (5) 式 得 到 的 了 值 为 : 
T = 25.46 


很 显然 导致 拒绝 H SPARER, Kruskal-Wallis 检验 功效 的 粗略 想法 可 由 
比较 两 个 检验 统计 量 的 值得 到 ， 两 个 检验 统计 量 有 相同 的 渐 近 分 布 ， 即 自由 度 为 3 
的 妇 2 分布， 但 是 由 Kruskal-Wallis 检验 得 到 的 值 25. 46 比 由 中 位 数 检验 计算 的 值 
17.6 大 得 多 ， 表 明了 它 对 样本 差异 更 敏感 . 
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因为 拒绝 了 H,， 所 以 可 用 多 重 比较 的 方法 .我 们 忽略 不 多 的 结 ， 并 用 下 面 的 简 


单 形式 


使 得 


SN-1-7) 
N-k 


剩 下 的 计算 如 下 


2 
3 
4 
3 
4 
4 


3 和 


Ri _ R, 
n; 


24.759 


S? = N(N + 1)/12 = 99.167 


4.681 
5.134 
4.950 
5.020 
4.832 
5.272 


| 2.041(24.911)1⁄2 (+ + 
j i 


_ (99.167)(33 — 25.464) _ 
TET 24.911 


1 


n) 


(7) 


(8) 


F 


在 每 个 情况 中 ， 第 二 列 的 数 都 超过 了 第 三 列 ， 所 以 我 们 可 以 说 ， 多 重 比较 方法 表明 


总 体 中 的 每 对 都 不 同 . 


对 有 很 多 结 的 情形 ， 应 当 毫 不 犹 隐 地 应 用 本 章 中 的 秩 检 验 ， kE, Kruskal- 
Wallis 检验 是 用 于 列 联 表 的 一 个 非常 好 的 检验 ， 如 下 表 所 示 ， 行 代表 有 序 分 类 ， 列 代 


表 不 同 的 总 体 . 


列 总 和 n, m 
OEA j rh i8 A 35 iK HRA 


R, = 平均 秩 
{ti + 1)/2 
ti + (t, + 1)/2 


ti + t, + (t, + 1)/2 


ç t. + (t. + 1)/2 


.. n, N = 全 体 总 和 
. i 行 的 平均 秩 是 RR,， 如 上 表 所 示 ， 它 是 


从 行 总 和 计算 出 的 ， 这 个 结构 和 普通 列 联 表 之 间 的 差别 是 ， 类 ( 行 ) 是 有 序 
的 ， 即 第 1 行 的 所 有 观测 值 认 为 是 互相 相等 的 ， 但 比 第 2 行 的 观测 值 小 ， 等 
等 ， 为 了 计算 检验 统计 量 ， 我 们 推荐 用 以 下 形式 . 记 R, 为 总 体 ( 对 应 列 ) j 


的 秩 和 ， 


并 用 下 面 的 等 式 计算 $ ， 


(9) 
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1 
N-1 
则 如 同 前 边 , 将 (9) 式 和 (10) 式 代 到 前 面 的 (3) 式 中 计算 检验 统计 量 T 注意 
到 (10) RM (4) 式 产 生 同 样 的 5 值 , 但 是 (10) 式 在 这 个 情形 下 更 容易 使 用 . 
如 果 拒 绝 零 假 设 ， 正 如 前 面 所 描述 的 那样 ， 就 可 以 用 多 重 比较 方法 来 查 明 差 异 在 
哪里 . 

例 5. 2. 2 
比较 上 学 期 3 名 教师 给 出 的 成 绩 ， 看 是 否 有 些 教师 给 的 成 绩 比 其 他 教师 给 的 偏 低 . 
零 假 设 是 : 


5*= 


[š t,R2 一 N(N + 1⁄4] (10) 


Ho: 3 个 老师 所 给 的 成 绩 相互 一 至 


感 兴趣 的 备 择 假设 是 : 
Hi: 有 些 教师 给 的 成 绩 比 其 他 教师 给 的 偏 低 
所 要 检验 的 成 绩 分 数 如 下 ， 
教师 
成 绩 1 2 3 行 总 和 平均 秩 
A 4 10 6 20 10.5 
B 14 6 7 27 34 
€ 1? 9 8 34 64.5 
D 6 7 6 19 91 
F 2.. c: . 3 9 105 


F 
9 


学 生 总 数 43 38 109 


从 (9) 式 可 求 得 列 秩 和 ， 
R = 2370.5  R,=21565 R3 = 1468 


检查 我 们 到 目前 的 计算 ， 的确 如 此 ， 对 N = 109, R, 的 和 应 该 等 于 N(N+1)/2= 
5995， 从 (10) 式 我 们 计算 得 到 S =941. 71， 最 后 由 (3) 式 可 得 T =0. 3209. 

水 平 为 0.05 的 临界 域 对 应 着 T 值 大 于 5.991 (自由 度 为 2 的 好 分 布 的 0.05 分 
位 数 ， 由 表 A2 获得 ) ， 很 明显 接受 零 假设 在 所 列 数据 基础 上 ， 没有 一 位 老师 打分 
比 其 他 老师 偏 高 或 者 偏 低 . Eg 

口 理论 假设 所 有 的 观测 是 来 自 于 相同 或 同 分 布 的 总 体 ， 那 么 我 们 可 得 到 了 的 精确 
分 布 ， 方 法 是 随机 化 ， 这 个 方法 也 用 于 求 Mann-Whitney 检验 统计 量 的 分 布 ， 即 在 前 
面 的 假设 下 ， 合 并 大 小 分 别 为 n,n,,…,n, 的 组 ， 则 秩 从 1 A N 的 每 一 个 排列 都 是 等 
可 能 的 ， 且 以 概率 n,1n,1…ni!/N1 发 生 ， 它 是 将 NN 个 秩 分 为 大 小 为 n,n,,…,n 组 
的 所 有 方式 个 数 的 倒数 ， 对 每 一 个 排列 ， 计 算 了 值 ， 把 所 有 对 应 了 值 相 等 的 概率 相 
加 ， 从 而 给 出 了 了 的 分 布 . 

例如 ， 如 果 在 三 样本 情形 下 , n. =2,n, =1,m =1,4 个 秩 有 12 种 等 可 能 的 排列 ; 
因此 每 个 排列 的 概率 为 1⁄12. 这 12 种 排列 与 对 应 的 了 值 如 下 . 


iD 
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样本 
排列 1 2 3 T 
1 L2 3% $ —9 
2 12 4 3 27 
3 ES 2 3 bB 
4 13 4 2 18 
5 4 Z 3 3 
6 14 3 2 03 
7 23 1 +£ 37 
8 i 
9 ta k. 3 PB 
10 2 4 3 J FA 
11 34 1i 2 32 
12 34 2 1 327 


r 


因此 ， 对 n, 22 =1,n, =l; HELERY f( x) AAA PR 21 F(x) 如 下 ， 


x fx) = P(T = x) F(x) = P(T < x) 


0.3 2/12 = 1/6 1/6 
1.8 4/12 = 1/3 1/2 
2.7 6/12 = 1/2 1.0 


7 了 的 分 布 的 大 样本 逼近 是 基于 以 下 事实 : (2) 式 中 的 R, 是 n, 个 随机 变量 的 和 ， 所 以 


对 于 较 大 的 n,;,， 我 们 可 以 用 中 心 极限 定理 ， 因 此 当 H, 为 真 时 ， 


R; — F(E;) 
v Var (R;) 
近似 地 服从 标准 正 态 随 机 变量 的 分 布 ， 由 定理 1. 4.5，R, 的 均值 和 方差 表达 如 下 
n (N + 1) 
E(R;) = u 
和 
Var (R) _ n (N + x i= H;) 
因此 ， 


Ë = mj _ ÍR, — [n(N + 1) /2]É 
VVar(R)] ní(N + 1)(N - ni) /12 
近似 于 自由 度 为 1 BJ y 随机 变量 的 分 布 ， 如 果 R 相互 独立 ， 则 和 
T= 5 (R, — [ni(N + 1)/2]¥ 
< n((N + 1)(N — n) / 12 


i=] 


(11) 


(12) 


(13) 


(14) 


的 分 布 可 以 用 自由 度 为 上 的 好 RRB. Æ, R 的 和 是 N(N+1)/2， 故 R, 之 间 是 
不 独立 的 ，Kruskal(1952) 证 明了 如 果 用 (Nn,)AN 乘 以 T' 的 第 i 项 , i=1,2,…,k， 则 


结果 


T= 之 AN+TDN712 


k. (R, 一 [n(N + 1) / 2] 
=1 


(15) 
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是 渐 近 于 自由 度 为 k-1 的 x 随机 变量 的 分 布 ，(15) ARE (5) 式 中 各 项 的 重 排 ， 
而 (5) 式 是 检验 统计 量 了 的 原始 定义 ， 因 此 ， 我 们 对 Kruskal-Wallis 检验 统计 量 的 
分 布 合理 地 运用 了 x iB MT. 口 

Kruskal 和 Wallis( 1952) 发现 ， 对 于 小 的 a (大 约 小 于 0.10) 和 选择 小 的 n,n, 
n 的 值 ， 真 正 的 显著 性 水 平 小 于 所 陈述 的 x 分 布 分 位 数 所 给 的 显 性 著 水 平 ， 这 表明 
x 分 布 通 近 在 很 多 (但 不 是 绝 大 多 数 ) 情况 下 提供 了 一 个 保守 的 检验 .Gabriel 和 
Lachenbruch( 1969 ) 指 出 ， 尽 管 样本 容量 可 能 很 小 ， 但 x WEE. Iman 和 Dav- 
enport(1976) 将 好 逼近 和 其 他 逼近 作 了 比较 . 

对 于 两 样本 情形 ，Kruskal-Wallis 检验 和 Mann-Whitney 检验 是 等 价 的 ， 回 顾 一 下 
(5.1 hp), fE Mann-Whitney 检验 中 ， 一 样本 是 X,,X,,…,X,， 而 另 一 个 样本 是 Y， 
Yast Yn 统计 量 了 由 (5.1.1) 式 定 义 如 下 : 


T = > R(X) (16) 
i=] 


即 是 XX 在 联合 样本 中 的 秩 和 ， 它 对 应 于 Kruskal-Wallis 检验 中 的 R,. Mann-Whitney XZ 
边 检验 就 是 ， 如 果 统 计量 了 太 大 或 太 小 ， 则 拒绝 五. 由 于 当 样 本 容量 很 大 时 ,TT 近 
似 于 正 态 ， 则 根据 定理 1.5.3， 者 

T — E(T) 

V Var (T) 
在 合适 的 标准 正 态 分 位 数 之 上 或 之 下 ， 或 者 若 它 的 平方 ， 

[T — ECD 

Var (T) 
在 自由 度 为 1 的 x 分 布 的 1-a 分 位 数 之 上 ， 我 们 就 可 以 拒绝 H, 所 以 ， 我 们 把 
(18) 式 中 的 量 作为 检验 统计 量 ， 则 自由 度 为 1 的 x 分 布 就 可 以 用 于 Mann-Whit- 
ney 双边 检验 中 .两 样本 的 Kruskal-Wallis 检验 也 利用 自由 度 为 1 的 x 分 布 来 检验 
t Mann-Whitney 双边 检验 中 相同 的 假设 . 事实 上 ，Kruskal-Wallis 检验 统计 量 与 
(18) 式 所 给 出 的 Mann-Whitney 检验 统计 量 的 形式 相同 ， 这 一 点 的 证 明 留 给 读者 
作为 习题 . 

Conover(1973a) 给 出 了 不 连续 分 布 中 使 用 秩 检验 的 论述 、 当 出 现 结 时 ，Klotz 和 
Teng( 1977) 讨论 了 检验 统计 量 的 精确 分 布 ， 多重 比 较 方法 是 简单 的 普通 参数 方法 ， 
称 为 Fisher 最 小 显著 差异 Conover 和 Iman( 1979) 对 此 有 过 描述 ， 它 用 秩 来 计算 ， 而 
不 是 用 数据 . 

普通 参数 方法 称 为 “ 单 因 素 方差 分 析 ,” 或 者 有 时 简称 为 单 因 素 下 检验 ， 所 用 的 
统计 量 如 下 : 


(17) 


(18) 


k 
[> Ti /ni 一 c)/@ — 1) 
Fae (19) 


k Ü k 
(Ey 4-Xmaj/N-D 


i=] j=] i=] 
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其 中 , T, 是 第 i 个 样本 中 观测 的 和 ，C = P'/N, 7T 是 所 有 观测 的 总 数 ， 如 果 
Kruskal-Wallis 检验 的 假设 有 效 ， 并 且 如 果 总 体 以 正 态 分 布 作为 共同 的 分 布 ， 那 
么 正统 计量 的 分 位 数 可 由 表 A22 给 出 .查看 六 =k-1 的 列 与 标记 有 上 有 =N-k 的 
fr, N 和 上 由 试验 给 出 ， 当 和 零 假 设 为 真 时 ， 违 反正 态 假设 通常 会 对 下 统计 量 有 一 
些 影响 ， 然 而 ， 当 H, 为 假 时 ， 在 某 些 非 正 态 的 分 布 类 型 中 , 下 检验 的 功效 可 能 
比 Kruskal-Wallis 检验 小 很 多 . 例如， 包含 离 群 值 的 数据 更 适合 用 Kruskal-Wallis 
检验 . 

相对 于 下 检验 ，Kruskal-Wallis 检验 的 渐 近 相对 效率 (A. R. E.) 从 来 不 会 小 
于 0. 864 ， 但 如 果 分 布 函数 有 相同 的 形状 ， 只 是 均值 不 同 ， 则 它 可 能 会 是 无 穷 大 
如 果 总 体 是 正 态 的 ， 则 A.R. E. 是 3/r = 0. 955; 对 于 均匀 分 布 ， 则 相对 于 下 检验 
的 A. R. E. 是 1.0; 对 双 指 数 分 布 ， 它 是 1.5. 与 中 位 数 检验 相 比较 ， 对 刚才 提 到 
的 3 种 分 布 ，Kruskal-Wallis 检验 的 A. R. E. 分 别 是 1.5 ,3.0 和 0. 75. 

类 似 于 Kruskal-Wallis 检验 ，Steel ( 1960 ) , Sherman ( 1965 ) 以 及 McDonald 和 
Thompson ( 1967) 用 秩 和 检验 来 作 多 重 比 较 ，Tobach , Smith, Rose 和 Richter( 1967 ) H 
供 了 作 多 重 比较 的 一 些 表 ，Rizvi 和 Sobel(1967 ) ,Sobel(1967 ) ,Rizvi,Sobel 和 Wood- 
worth( 1968) 以 及 Puri 和 Puri(1969) 描 述 了 挑选 最 好 总 体 的 方法 .对 删 失 数据 的 秩 检 
验 由 Basu ( 1976b ) 和 Breslow (1970) 提出; 检验 有 序 备 择 假 设 的 秩 检 验 由 
G. R. Shorack( 1967) ,Odeh(1971,1972) 以 及 Tryon 和 Hettmansperger( 1973) 提出 ; H 
方差 分 析 的 秩 检验 由 Puri 和 Sen( 1969a) 提出 ,其 他 关于 秩 检验 和 几 个 独立 样本 的 工 
作 见 Sen( 1962 ,1966 ) , Matthes 和 Truax ( 1965 ) ,Quade ( 1966 ) , Crouse ( 1966 ) , Sen 和 
Govindarajulu ( 1966 ) , Odeh ( 1967 ) , Deshpande ( 1970 ) 以 及 Bhapkar 和 Deshpande 
(1968).，Quade(1967 ) 讨论 了 协 方差 分 析 ，Brunden ( 1972 ) 考虑 用 秩 来 分 析 2 x 3 列 
KK. 


习题 
297] L 检验 来 自 3 个 不 同类 型 的 电灯 泡 的 随机 样本 ， 看 灯泡 能 亮 多 久 ， 结 果 如 下 . 
牌子 
A B C 
73 84 82 
64 80 79 
67 81 71 
62 77 75 


70 
这 些 结果 表明 这 几 个 牌子 之 间 有 显著 差别 吗 ? 如 果 有 ， 哪 些 牌子 不 同 ? 
2. 对 20 个 新 雇员 试用 4 个 工作 培训 项 目 ， 每 个 培训 项 目 随机 分 配给 5 个 雇员 .20 个 雇员 在 
相同 的 管理 人 员 安 排 下 进行 ， 在 某 一 指定 的 时 期 结束 后 ， 管 理 人 员 根 据 雇 员 的 工作 能 力 
对 他 们 进行 排序 ， 将 最 小 的 秩 赋 给 工作 能 力 最 低 的 雇员 . 
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项 目 秩 
1 4, 6, 7, 2, 10 
2 1, 8, 12, 3, 11 
3 20, 19, 16, 14, 5 
4 18, 15, 17, 13, 9 


这 些 数 据 表 明 不 同 的 培训 项 目的 效率 有 差异 吗 ? 如 果 有 ， 它 们 可 能 是 哪些 ? 
在 很 多 不 同 的 农场 检查 由 水 和 风 造 成 农场 土地 的 破坏 ， 同 时 也 记录 了 在 每 个 农场 上 实施 
耕作 的 类 型 ， 结 果 如 下 ， 


耕作 类 型 
最 小 限度 耕作 ”等 高 地 形 梯田 其 他 
破坏 程度 农场 数 
没有 破坏 17 19 4 21 
轻微 破坏 3 10 4 42 
中 等 破坏 0 2 = 34 
严重 破坏 0 0 2 6 


耕作 类 型 影响 破坏 程度 吗 ? 如 果 是 ， 哪 些 耕 作 类 型 有 显著 差异 ? 
由 同一 公司 生产 的 3 种 不 同类 型 的 收音 机 ， 都 有 一 年 的 保质 期 ， 下 表 记 录 了 和 多少 个 收音 


机 需要 替换 ， 多 少 个 是 可 修理 的 ， 或 者 多 少 个 在 保质 期 内 没有 退回 的 数据 . 298 
类 型 
A B cC 
替换 的 12 3 6 
修理 的 10 8 7 
未 退回 的 8 9 58 


不 则 收音 机 类 型 的 可 信赖 度 看 起 来 有 显著 差别 吗 ? 如 果 有 ， 哪 些 看 起 来 有 差别 ? 
在 指定 的 一 段 时 间 内 ， 给 白鼠 喂 5 种 食物 中 的 一 种 后 ， 测 量 白鼠 肝脏 内 铁 的 吸收 量 ，5 种 
食物 中 的 每 一 种 都 随机 地 分 配给 了 10 只 白鼠 . 

食物 A 食物 B 食物 C 食物 D 食物 下 


223 5.59 4.50 1.35 1.40 
1.14 0.96 3.92 1.06 1.51 
2.63 6.96 10.33 0.74 2.49 
1.00 1.23 8.23 0.96 1.74 
1.35 1.61 2.07 1.16 1.59 
2.01 2.94 4.90 2.08 1.36 
1.64 1.96 6.84 0.69 3.00 
1.13 3.68 6.42 0.68 4.81 
1.01 1.54 3.72 0.84 5.21 
1.70 2.59 6.00 1.34 5.12 


不 同 食物 会 影响 白鼠 肝脏 内 铁 的 吸收 量 吗 ? 


[295] 


6. 
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把 3 个 减肥 计划 的 每 一 个 分 配给 了 12 名 志愿 者 ， 志 愿 者 被 分 配 到 哪个 计划 是 随机 的 ， 总 
共有 36 位 志愿 者 ， 假 设 他 们 是 来 自 可 能 要 试用 一 种 减肥 计划 人 和 群 中 的 随机 样本 ， 检 验 零 
假设 : 在 3 种 计划 下 减肥 量 的 概率 分 布 没有 差异 ， 备 择 假 设 是 : 在 3 种 计划 下 减肥 量 的 概 
率 分 布 有 差异 .每 个 人 减 掉 的 磅 数 结果 如 下 . 

计划 A 计划 B 计划 C 


2 17 17 5 29 5 
12 4 15 6 3 25 
5 25 3 19 25 32 
4 6 19 4 28 24 
26 21 5 9 11 36 
8 6 14 7 7 20 


思考 题 


t 


证 明 在 没有 结存 在 时 ，(3) 式 和 (5) 式 是 等 价 的 . 
在 n, =3, =2, =1， 且 没有 结 的 情形 下 ， 求 当 H 293804, Kruskal-Wallis 检验 统计 量 
的 精确 分 布 ， 将 你 的 结果 与 表 A8 给 出 的 分 位 数 进行 比较 . | 
在 两 样本 情形 中 ， 我 们 更 喜欢 用 Mann-Whitney 检验 而 不 是 Kruskal-Wallis 检验 的 原因 
有 哪些 ? 

证 明 (10) RA (4) 式 是 等 价 的 . 

假定 (19) 式 中 的 已 统计 量 是 用 秩 R(X, ) ， 而 不 是 用 观测 值 X; 计 算 的 ， 那么 证 明 以 下 由 
(3) 式 给 出 的 关于 政和 了 的 关系 式 


pa T= 


(N-1-D/(N-h 
成 立 ， 因 此 ， 如 果 用 秩 计算 下 ， 则 当 了 值 较 大 时 拒绝 H, 与 当下 值 较 大 时 拒绝 H, 是 等 价 的 . 


5.3 等 方差 检验 
几 个 总 体 比较 的 通常 标准 是 基于 均值 或 总 体 其 他 位 置 的 度量 ， 然 而 在 某 些 情形 


下 ， 总 体 的 方差 或 许 是 感 兴趣 的 量 ， 例如， 已 有 断言 称 ; 碘 化 银 撤 在 云 里 的 作用 是 
提高 导致 降雨 的 方差 ， 这样 的 断言 可 以 用 本 节 提 出 的 方法 来 检验 


方差 的 检验 类 似 于 上 节 提 出 的 均值 的 检验 ， 即 检验 HEX) ECY), HRANI 


立 的 样本 合并 、 排 序 ， 并 用 X 的 秩 和 作为 检验 统计 量 ， 回 想 一 下 XX 的 方差 的 定义 ， 
CH (X-u) 的 期 望 值 ， 此 处 是 X 的 均值 ， 因 此 要 检验 E[ (X -As) ] =EL(Y,- 


1,)*] ， 一 个 合理 的 做 法 是 ， 记 录 来 自 两 个 独立 样本 的 (X-u) M (Y,-u,) 的 


值 ， 并 给 它们 赋予 秩 ， 再 用 (X, -内 六 的 秩 和 作为 检验 统计 量 ， Talwar 和 Gentle 
(1977) 研 究 了 这 个 方法 ， 尽 管 这 个 方法 可 以 用 ， 但 给 秩 先 平方 后 相 加 会 得 到 更 大 的 
功效 ， 本 节 将 对 这 样 一 个 检验 进行 更 确切 的 描述 . 
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和 方差 的 平方 秩 检验 


数据 数据 是 由 两 个 随机 样本 组 成 的 ， 记 X,X,X 为 来 自 总 体 1， 容 量 为 n 
的 随机 样本 ，Y ,Y,,…,Y, 为 来 自 总 体 2、 容 量 为 m 的 随机 样本 .将 每 个 X fll Y, 转 
换 为 它 到 均值 的 绝对 离 差 
Ui=|X;— ml i=1,.. „n (1) 
和 
V; = |Y; — u+|,j = 1,. . m (2) 


其 中 , m M 是 总 体 1 和 2 的 均值 ， 如 果 j,， 和 jw RA, XRG, IRB m, 
则 以 下 的 检验 仍然 近似 有 效 . 

以 通常 方式 将 秩 1 S| n + m WA U 和 V 的 合并 样本 ， 如 果 U 和 /或 V 的 几 个 值 确 
实 互相 相等 (存在 结 ) ， 则 给 它们 的 每 个 值 都 赋 以 没有 结 时 要 赋 给 它们 的 秩 的 平均 
值 ， 记 R(U,) 和 R(V,) 为 赋 以 的 秩 或 平均 秩 ， 注 意 ， 对 U, 和 V, 的 排序 与 对 (X, - 
m) 和 (YY, -jw)? 的 排序 结果 相同 ， 但 比 它 更 容易 . 
假定 条 件 

1 两 个 样本 都 是 来 自 各 自 总 体 的 随机 样本 . 

2. 除了 每 个 样本 内 观测 相互 之 间 独 立 外 ， 两 个 样本 之 间 也 相互 独立 . 

3. 度量 尺度 至 少 是 区 间 的 . 
检验 统计 量 如果 U 的 值 与 V 的 值 没 有 结 ， 则 赋 给 总 体 1 的 秩 的 平方 和 可 以 用 作 检 
验 统计 量 . 

T= > [ROU B) 


如 果 存 在 结 ， 用 了 减 去 它 的 均值 再 除 以 它 的 标准 差 ， 就 得 到 
T 一 HR2 
| 
N(N — 1) £ N - 10 ) 


i=1 


其 中 ,N=n+m，R 代表 两 个 样本 合并 的 平方 秩 的 平均 : 
— 1 n m 
R? = sŠ IRU? + > Rv} (8) 


Ti = (4) 


ER 代表 秩 的 四 次 寡 的 和 : 
N n m 
>= = > [R(Up]* + 之 [R(V;)] (6) 
i= j= j= 

零 分 布 “ 当 没有 结 , mn 和 10, m<10 时 ， 表 A9 中 给 出 了 了 的 精确 零 分 布 的 分 位 数 . 


当 样本 容量 大 于 10 时 ， 表 Al 给 出 了 下 面 基 于 标准 正 态 分 位 数 z BONE ARB R, È 
可 以 用 于 获得 7 的 近似 分 位 数 w, 
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_n(N+1X2N+1 N + 1)(2N + 1)(8N 


其 中 ,， N=n+m. 

T, 的 近似 零 分 布 是 标准 正 态 分 布 ( 见 表 Al ) 
假设 
A. (双边 检验 ) 

Ho: 除 了 它们 的 均值 可 能 不 同 外 ,X 和 Y 同 分 布 
H;: Var (X) # Var (Y) 

如 果 T (或 有 结 时 的 T) 大 于 它 的 1 - a/2 分 位 数 或 小 于 它 的 av2 分 位 数 ， 则 以 
显著 性 水 平 a 拒绝 H,， 我 们 可 以 从 表 A9 或 (7) 式 得 到 了 情况 下 的 分 位 数 ， 如 果 用 
7 ， 则 分 位 数 可 以 从 表 Al 得 到 . 

如 果 用 Ti ， 双 边 p- 值 是 P(Z<T,) 或 P(Z=T) 中 较 小 者 的 2 倍 ， 这 两 个 概率 
可 以 直接 从 表 Al 中 获得 . 如 果 用 T， 可 以 从 表 A9 中 获得 近似 的 p- 值 ， 为 找到 导致 
拒绝 H, 的 最 小 双边 检验 ， 可 用 正 态 近似 ， 

产值 = 2: ( 单 边 p- 值 中 较 小 的 ) (8) 
其 中 ， 左 边 p- 值 近似 为 : 
. T — n(N + 1)(2N + 1) /6 
左边 p 信 =P(Z< J + a azar) @ 


而 右边 p- 值 近似 为 : 
右边 产值 = p [Z> T- n(N + 1)QN + 1) /6 ) (10) 
Vmn(N + 1)QN + 1)(8N + 11) /180 
B. (左边 检验 ) 


Ho: 除了 它们 的 均值 可 能 不 同 外 ,X 和 YY 同 分 布 
H;: Var (X) < Var (Y) 
如 果 T (或 有 结 时 的 Ti ) 小 于 它 的 a 分 位 数 ， 则 以 显著 性 水 平 a 拒绝 H, 我 们 

可 以 从 表 A9 或 (7) 式 获 得 T 工 情况 下 的 分 位 数 ， 如 果 用 T,， 则 分 位 数 可 以 从 表 Al 
得 到 .，p- 值 是 在 零 分 布下 小 于 或 等 于 T( 或 7) 的 概率 ”对 于 T， 它 近似 地 由 (9) 式 
给 出 ， 而 对 于 Ti ， 用 表 A1, H P(Z<7, ) 给 出 p- 值 . 
C. (右边 检验 ) 
Ho: 除 了 它们 的 均值 可 能 不 同 外 , X 和 Y 同 分 布 
Hi: Var (X) > Var (Y) 
如 果 T (或 有 结 时 的 Ti ) 大 于 它 的 1 -a 分 位 数 ， 则 以 显著 性 水 平 a 拒绝 有 H,， 我 们 可 
以 从 表 A9 或 (7) 式 获得 到 了 情况 下 的 分 位 数 ， 如 果 用 TT,， 则 分 位 数 可 以 从 表 Al 
得 到 ，p- 值 是 在 零 分 布下 大 于 或 等 于 T (HT) 观测 值 的 概率 ， 对 于 了 ， 它 近似 地 由 
(10) 式 给 出 ， 而 对 于 T, ， 可 直接 从 表 Al 得 到 p- 值 . 
计算 机 辅助 ”这 个 检验 可 以 用 StatXact 实现 ， 并 称 为 Conover 检验 .一 一 一 一 一 一 专 
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多 于 两 个 样本 的 检验 


如 果 有 3 个 或 更 多 的 样本 ， 这 个 检验 可 简单 地 修改 为 检验 几 个 方差 相等 ， 正 像 
两 样本 时 描述 的 那样 ， 用 每 个 观测 减 去 它 的 总 体 均 值 (或 当 j, 未知 时 ， 用 它 的 样本 
均值 )， 并 将 负 值 换 为 正 值 ， 如 前 面 两 样本 所 述 ， 对 合并 的 绝对 离 差 从 小 到 大 排序 ， 
当 有 结 时 ， 赋 以 平均 秩 ， 计 算 每 个 样本 秩 的 平方 和 ， 记 5, ,5,,…,5, 为 上 个 样本 的 秩 
平方 和 .， X, S 对 应 于 前 面 两 样本 情形 中 的 也 
Ho: 除 了 它们 的 均值 可 能 不 同 外 , 所 有 k 个 总 体 同 分 布 
Hi: 有 些 总 体 的 方差 不 彼此 相等 
检验 统计 量 为 : 
k &2 
n=- 四 [NB (11) 
HP, n = 样本 j 中 的 观测 数 . 
N =n. + n> + : : ° + nk 


S = 样本 j 中 秩 的 平方 和 
k 
SNA S = 所 有 秩 平 方 的 平均 


ph. L. P Ri 一 nē» | 
N-11⁄ 
LR 代表 每 个 秩 四 次 赛 的 和 ， 如 果 没 有 结 ，D- 和 5 可 简化 为 
D? = N(N + 1)(2N + 1)(8N + 11) /180 (12) 
和 
5=(N+1)(2N+1)/6 (13) 
零 分 布 近 似 为 自由 度 为 k-1 的 x 分 布 ， 在 表 A2 中 给 出 了 它 的 上 分 位 数 . 
如 果 T, 超过 从 表 A2 得 到 的 自由 度 为 k-1 的 x 分 布 的 1 -a 分 位 数 ， 则 拒绝 零 假 设 . 
p- 值 近似 为 自由 度 为 k-1 的 x 随机 变量 大 于 TT, 的 观测 值 的 概率 ， 如 果 拒 绝 了 
H,， 如 前 一 节 所 述 ， 我 们 可 以 作 多 重 比较 ， 此 时 ， 如 果 下 列 不 等 式 满足 ， 就 说 总 体 i 


和 j 的 方差 不 同 . 

S, S; N-1-TH/1 1W 

sa >a. [PN Tn 2) (++) (14) 
其 中 ,1, ,是 自由 度 为 N-k 的 1 分 布 的 1 -a/2 分 位 数 ， 它 可 从 表 A21 中 获得 . 
例 5.3.1 
食品 包装 公司 想 要 相当 肯定 ， 它 们 生产 的 谷类 食品 包装 盒 里 实际 所 含 的 谷类 食品 得 
司 数 至 少 是 包装 盒 外 边 贴 的 那个 量 . 为 了 做 到 这 点 ， 给 每 盒 的 平均 量 必 须 稍微 超出 
它 所 做 广告 的 量 ， 因 为 包装 机 器 可 能 会 造成 不 可 避免 的 变化 量 ， 给 盒子 装 谷类 食品 
有 时 会 稍微 多 一 点 或 稍微 少 一 点 ， 因 为 每 盒 的 平均 量 会 调整 到 和 广告 上 的 平均 量 很 
接近 ， 所 以 有 较 小 变化 量 的 机 器 会 给 公司 省 钱 . 
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检验 一 台新 机 器 ， 看 它 是 否 比 现 有 的 机 器 变化 量 更 小 ， 以 便 可 以 购买 它 来 代替 
旧 机 器 ， 用 现 有 的 机 器 给 几 个 盒子 装 满 谷类 食品 ， 测 量 每 个 盒子 装 的 量 ， 对 新 机 器 
也 进行 同样 的 操作 ， 要 检验 


Huo: 两 台 机 器 有 相同 的 方差 
Hi: 新 机 器 有 较 小 的 方差 
测量 值 和 计算 结果 如 下 . 
原始 测量 绝对 离 差 # 秩 平方 
现 有 的 新 的 。” 现 有 的 ”新 的 ” 现 有 的 ”新 的 现 有 的 。” 新 的 
(X) (Y) (u) (V) 
10.8 10.8 .06 .01 4 2 ( 结 ) 16 i 
11.1 10.5 .36 29 10 8 100 64 
10.4 11.0 .34 .21 9 7 81 49 
10.1 10.9 .64 .11 12 6 144 36 
11.3 10.8 .56 01 11 2 ( 结 ) 121 4 
10.7 .09 5 25 
0 .01 2 ( 结 ) SeN 4 
X= 10.74 Y= 10.79 T= 462 


T= 平方 秩 的 和 ( 现 有 的 ) = 462 
Ri= (16 +100 +-+: +25 +4) = 54 


N 
` R! = (16) + (100)? + + - - + (25)? + (4} = 60,660 
i=1 


T, = _ %62-559 = 2.3273 


(5)(7) = eal 
kea c ET G| 


前 面 的 假设 与 检验 集 C 相符 ， 因 为 H 指定 新 机 器 (Y) 有 更 小 的 方差 ， 则 近 
似 水 平 a 38 0. 05 的 临界 域 对 应 着 T, 的 值 大 于 1.6449 (X Al 中 的 0.95 分 位 数 ). 
在 这 种 情况 下 ，7 超过 1. 6449， 所 以 拒绝 H,. 将 观测 到 的 九 =2.3273 与 表 Al 中 
的 分 位 数 比 较 ， 发 现 P- 值 大 约 是 0.01. 
在 这 个 例子 中 ， 只 要 U 的 值 和 VV 的 值 没 有 结 ， 计 算 结果 就 会 有 相当 大 的 简化 . 
于 是 可 以 用 秩 而 不 用 平均 秩 ， 并 使 用 精确 表 . 在 这 个 例子 中 ， 只 有 YY 的 3 个 值 存 在 
结 ， 所 以 当 3 个 结 的 值 出 现时 ， 在 最 右边 的 列 中 , 用 1 =1,2* =4 和 3” =9， 而 不 用 
2 =4， 检 验 的 其 余部 分 按 没 有 结 来 计算 . 这 次 了 的 值 碰巧 没有 变 ， 对 n=5,m=7， 
它 比 表 A9 中 的 0.95 分 位 数 410 大 ， 而 且 表 明 这 个 近似 检验 的 p- 值 大 约 为 0.01 E 
口 理 论 ” 只 要 两 个 随机 变量 X 和 YY 除了 有 不 同 的 均值 fü u, 外 是 同 分 布 的 ， 则 X- 
m A Y-m 不仅 有 零 均 值 ， 而 且 它 们 也 是 同 分 布 的 ， 这 意味 着 U = |X- | 和 V= 
|Y -jp | 有 相同 的 分 布 ， B U2 = (X-u) MV = (Y -u,) 也 有 相同 的 分 布 ， 所 以 对 
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于 XX 和 YY 的 随机 样本 ,UV 和 VV 是 独立 同 分 布 的 .因此 像 Mann-Whitney 检验 中 的 那 
ÉE, U 的 秩 的 每 种 分 配 都 是 等 可 能 的 ， 且 在 5.1 节 中 能 找到 关于 秩 的 任何 函数 的 
分 布 . 

注意 ，U, <U, MBAL Vi <U, HU U 的 秩 与 U 相应 的 秩 相同 、 因 为 我 们 感 
兴趣 的 是 比较 E( 矿 ) 和 E( 议 )， 故 我 们 应 该 看 U M V 的 秩 ; (B UA V 的 秩 是 等 价 
+ U` MV 的 秩 而 且 更 容易 . 

区 别 这 个 秩 检验 和 前 面 秩 检验 的 另外 一 个 重要 差异 就 是 ， 所 用 的 是 平方 秩 而 不 
是 秩 本 身 ， 我 们 用 的 是 得 分 而 不 是 秩 ， 用 R 的 函数 a(R) 来 记得 分 ,在 检验 统计 量 中 
用 a(R) 来 代替 R， 记 了 为 关于 一 个 样本 的 得 分 的 和 ， 在 上 述 检验 中 ， 得 分 a(R) = 
R* .我 们 可 用 像 5. 1 节 中 的 方法 来 求 了 的 分 布 ， 如 果 样 本 容量 是 m=3, 普 =4， 从 7 个 
秩 中 选 出 3 个 的 方式 有 35 种 . 1, 2, 3 这 3 个 秩 相 对 应 的 得 分 是 a(1) ,a(2) 和 a(3)， 
它们 将 用 来 计算 检验 统计 量 了 的 值 (依赖 于 所 用 的 得 分 ) ， 其 概率 为 1/35， 从 7 个 秩 
中 选 出 3 个 的 35 种 方式 给 出 了 35 个 T 值 ， 可 能 有 相同 的 ， 这 时 用 5. 1 节 中 的 方法 很 
简单 地 就 得 到 了 了 的 概率 函数 . 

uH 为 真 时 ， 对 了 用 大 样本 的 正 态 和 逼近 ， 这 时 有 必要 求 出 工 的 均值 和 方差 ,我 
们 有 

T =X a(R) (15) 


此 时 ， MR 代表 Ch U, 在 U 和 V 合并 样本 中 的 秩 . 我 们 先 对 一 般 的 得 分 
a(R) 找 出 E(T) 和 Var(T)， 最 后 以 a( R) = R° 来 代替 . 
由 定理 1.4. 1,T 的 均值 可 写 为 : 


E(T) = E PË a(R) | = > Ela(R)] (16) 
因为 对 每 个 j=1,2,…,N,P(R, =j) =1/N ， 我 们 有 
N 1 1 N Z 
Ela(R;)] = "一 一 一 j) = 17 
[a(R)] 2a() N N&G) a (17) 
( 记 为 a)， 对 所 有 的 i 从 1 到 n, 它 都 是 相同 的 ， 所 以 (16) 式 变 为 
E(T) = na (18) 


其 中 ,a 是 所 有 得 分 的 平均 . 
对 于 了 的 方差 ， 由 定理 1.4.3， 我 们 得 到 


Var (T) = 5i Var [a(R] + °. > Cov [a(R;), a(R;)] (19) 
i=l i=1 j=1 
ij 
其 中 ， 由 方差 的 定义 ， 
N 
Var [a(R)] = E([a(R) — P) = X lao — AP- = (20) 
=} 


以 及 由 协 方 差 的 定义 ， 
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Cov [a(R),a(R;)] = E([a(R) 一 可 [a(Ri) 一 可 
N N 
= z _—a— 1 _ 


k=1 1=1 
k=] 


KA, XAR k#l,P(R, =k,R, =l) =1/[N(N-1)], 我们 在 (21) 式 的 表达 式 中 
同时 加 上 上 和 减 去 上 = /的 项 ， 使 之 简化 为 : 


N N 
N -PTAR TE E 
Cov [a(R), a(R)] = > [a(o — a] Z la) ~ ANN = (22) 


(21) 


N ata 1 
之 ago — 2) NN -1 
但 由 于 a 在 (17) 式 中 已 定义 ， 故 第 一 个 和 等 于 零 ， 所 以 (22) 式 又 简化 为 


Covla(R),a(R)] =-———A (23) 


其 中 , 4 由 (20) REX. MEK (20) RA (23) 式 中 的 方差 和 协 方差 项 代入 到 
(19) 式 ， 得 到 


=nA- nn- 1) 4 
-"N-n) , 
N-1 
E A (24) 
由 于 N -n=m， 当 有 结存 在 时 ，(18) 式 和 (24) 式 在 5.1 节 和 5.2 节 中 已 用 过 ， 而 


且 在 本 章 后 面部 分 也 会 有 用 ， 现 在 我 们 感 兴趣 的 是 平方 秩 检验 中 a(R) =R 的 情形 ， 此 
时 互 可 写 为 (4) RPR, I a 
$ pg — a]? = > uor - N(a) (25) 
来 简化 计算 ， 可 知 (4) 起 的 分 母 是 (24) 式 的 平方 要 
两 样本 情形 推广 到 大 个 样本 的 情形 完全 类 似 于 把 两 样本 Mann-Whitney 检验 推广 


到 大 个 样本 的 Kruskal- Wallis 检验 情形 . 即 对 个 样本 中 的 每 一 个 找 得 分 和 ， 记 为 
Dy Hi (18) 式 和 (24) 式 ， $, 的 均值 和 方差 为 


E(S;) = na (26) 
和 
(N 一 
Var (S) = TCD DN 2 之 [a(ü) — aÉ (27) 


如 同 在 Kruskal-Wallis 检验 中 那样 ,用 (N - [S, - E(S,)] /Var( S,) , 
i=1,2,…,k， 并 加 到 一 起 得 . 
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k (S; 一 nia) 
n> (28) 
其 中 
D2= 1 Si ) -下 = 人 2- Na) 29 
-N12 la) - šP = 12 OP- N(a) (29) 
(28) 式 可 简化 为 
k œ2 
T= [3 - NGy'| (30) 
当 得 分 是 秩 的 平方 时 ， 它 与 (11) 式 一 致 ， 建 议 使 用 的 多 重 比较 方法 是 一 个 近似 的 
方法 ,但 当 样 本 容量 变 大 后 就 成 为 精确 方法 . 口 


如 果 X 和 Y 的 总 体 服从 正 态 分 布 ， 合适 使 用 的 统计 量 是 两 个 “样本 方差 ”的 


比值 ， 
1 


r 
Fons TOE (31) 
mi 
ERRA FA. EK A22 中 的 =n-1 列 ,k=m-1 行 给 出 了 F 的 上 侧 分 位 数 ， 下 
侧 分 位 数 没 有 给 出 ， 但 可 以 由 =m--1 列 , ,=n-1 行 所 得 上 侧 分 位 数 求 倒数 得 
到 ， 合 适 的 单 边 和 双边 检验 也 因此 而 得 到 . 

正如 Siegel 和 Tukey(1960) 所 指出 的 , 检验 对 正 态 分 布 的 假设 非常 敏感 ， 真 正 
的 分 布 可 能 是 对 称 的 ， 很 像 正 态 分 布 ， 例 如 双 指 数 分 布 ， 但 真正 的 显著 性 水 平 可 能 
是 假设 显著 性 水 平 的 2 倍 或 3 倍 大 ， 正 因为 如 此 ， 除 非 总 体 确实 是 正 态 的 ,，F 检验 不 
是 一 个 很 安全 的 检验 . 

当 总 体 是 正 态 分 布 时 ， 如 果 用 平方 秩 检 验 ， 而 不 是 用 下 检验 ， 则 渐 近 相对 效率 
(A. R. E. ) A 15/(2 œ) =0.76. 然而 ， 对 于 双 指 数 分 布 ，A. R. E. Æ 1.08; 对 于 
均匀 分 布 ，A. R. E. 是 1. 00， 相 同 的 效率 也 适用 于 大 个 样本 的 情形 . EE, F 检验 对 
正 态 分 布 假设 的 敏感 性 ， 加 上 它 在 一 些 常用 非 正 态 的 情形 下 功效 较 低 的 特点 ， 因 此 
我 们 应 尽量 考虑 非 参 数 的 方差 检验 . 

在 平方 秩 检验 中 ， 用 义 和 Y 代替 XX 和 YY 真正 的 均值 ， 使 得 检验 是 近似 的 而 不 是 
精确 的 ， 而 检验 统计 量 的 精确 分 布依 赖 于 总 体 的 真实 分 布 ， 正 如 Conover, Johnson 
和 Johnson( 1981 ) 对 56 个 方差 检验 所 做 的 广泛 模拟 研究 所 示 ， 当 总 体 分 布 相当 偏 斜 
时 ， 检 验 会 有 问题 . 由 于 总 体 的 偏 斜 ， 使 得 显著 性 水 平 可 能 变 得 很 大 ， 所 以 在 这 种 
情况 下 ， 我 们 推荐 使 用 X 和 Y 的 样本 中 位 数 来 调整 代替 样本 均值 ， 然 而 ， 这 两 种 方 
法 都 给 出 了 一 个 渐 近 分 布 自由 的 检验 ， 即 当 样本 容量 变 大 时 ， 近 似 方法 将 变 为 精确 
方法 . 

另 一 个 受 欢 迎 的 两 样本 尺度 问题 的 非 参 数 检验 是 基于 统计 量 
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n 2 
T= > [zoo = — (32) 


其 中 , P(X,) 是 X, 的 秩 ， 像 Mann-Whitney 检验 中 一 样 ， 它 是 由 Mood( 1954 ) 提出 的 . 
Laubscher, Steffens 和 DeLange ( 1968 ) 在 相同 分 布 函 数 的 零 假 设 下 给 出 了 精确 表 . 
Hollander( 1963 ) 给 出 了 相关 统计 量 


T = > [R(X) — R.J (33) 
i=) 


的 零 分 布 表 ， 其 中 
R, =$ R(X) 


Ansari 和 Bradley ( 1960) 讨论 了 Mood 检验 和 其 他 检验 的 A. R. E.. 

Conover 和 Iman(1978a) 给 出 了 平方 秩 检验 的 进一步 讨论 和 更 广泛 的 表 ，Talwar 和 
Gentle( 1977) 检查 了 这 个 检验 的 微小 变化 ， 其 他 尺度 检验 由 Sen(1963 ) ,Puri(1965 ) ， 
Mielke( 1967) , Duran 和 Mielke ( 1968 ) , Shorack ( 1969 ) ,Hwang 和 Klotz ( 1975 ) 所 考虑 ， 
Fligner 和 Killeen(1976 ) 考 虑 了 两 样本 的 情况 ，Tsai Duran 和 Lewis ( 1975) 考虑 了 几 个 
样本 的 情况 .Conover, Johnson 和 Johnson (1981 ) 对 56 个 方差 检验 进行 了 全 面 比较 . 
Lepage( 1971 ,1973 ,1977 ) ,Mielke( 1972 ) , Duran , Tsai 和 Lewis ( 1976 ) 提出 了 设计 用 来 同 
时 检测 位 置 和 尺度 差异 的 检验 ，Gibbons(1967) 和 Hollander(1968) 研 究 了 尺度 秩 检验 和 
位 置 秩 检验 的 相关 性 Moses(1963 ) ,van Eeden( 1964) ,Basu 和 Woodworth ( 1967 ) , Bauer 
(1972) ,Laubscher 和 Odeh( 1976) 以 及 Bhattacharayya( 1977) 进一步 考虑 了 尺度 参数 估 
计 ， 如 果 位 置 参 数 未 知 ， 且 可 能 不 相等 ， 一 个 修改 的 检验 见 Raghavachari( 1965a) , Puri 
(1968) 和 Nemenyi(1969)， 进一步 的 参考 文献 可 以 在 Duran( 1976) 的 一 个 非常 好 的 评论 
文章 中 找到 ,或 者 是 在 Daniel(1979) 的 参考 文献 中 找到 . 


习题 


1. 血库 中 心 留 有 几 个 献血 者 心跳 速率 的 记录 ， 
男 58 76 82 74 79 65 74 86 
女 66 74 69 76 72 73 75 67 68 
男士 之 间 的 变化 显著 地 比 女士 之 间 的 变化 大 吗 ? 
2. 近 几 年 来 ， 大 面积 建 起 来 了 一 个 特定 的 水 域 ， 有 住宅 区 发 展 ， 水 坝 等 等 ， 将 这 个 水 域 的 
水 流速 率 的 一 个 随机 样本 (每 分 钟 立方 英尺 ) 与 早 些 年 的 水 流速 率 的 样本 作 比较 ， 看 变 
化 量 是 否 改 变 . 
现在 的 速率 32 36 41 27 35 48 31 28 
之 前 的 速率 39 21 58 46 30 22 17 19 
方差 有 显著 差异 吗 ? 
3, 将 五 年 级 的 学 生 随 机 分 配 到 3 个 不 同 的 教室 ,来 比较 教学 的 3 种 不 同 的 方法 .在 年 初 测试 
一 下 每 个 学 生 达 到 的 成 绩 水 平 ( 用 一 个 标准 化 考试 来 测量 ) ， 在 年 底 再 测试 一 次 ， 每 个 学 
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生成 绩 的 增长 记录 如 下 . 
教学 方法 成 绩 的 增长 
单元 教学 0.7 1.0, 2.0, 1.4 0.5, 0.8, 1.0, 1.1 1.9, 1.2, 1.5 
个 人 学 习 1.7, 2.1, —0.4, 0, 1.0, 1.1, 0.9, 2.3, 1.3, 0.4, 0.5 
露天 教室 0.9, 0.9, 1.0, 0, 0.1, —0.6, 2.2, —0.3, 0.6, 2.4, 2.5 


这 3 种 教学 方法 在 方差 上 有 差异 吗 ? 如 果 有 ， 哪 个 方法 在 变化 上 有 所 不 同 ? 

4. 把 一 个 投资 班 的 学 生 分 为 3 组 ，! 组 教 投 资 证 券 ， 第 2 组 教 投 资 蓝 筹 股 , 第 3 组 教 纯 理论 
知识 ， 每 个 学 生 “ 投 资 ”( 仅 在 纸 上 ) $ 10，000， 并 在 3 个 月 后 评估 假设 的 收益 或 损失 , 
结果 如 下 . 

证 券 蓝筹 股 纯 理 论 知 识 


146 176 一 540 
180 110 1052 
192 212 642 
185 108 一 281 
153 196 67 
方差 的 差别 显著 吗 ? 如 果 是 ， 哪 组 是 有 显著 的 差异 ? 


思考 题 


I. 对 n=3,m=4, 求 出 (3) 式 中 给 出 的 了 的 精确 分 布 ， 并 将 其 与 表 A9 给 出 的 分 位 数 作 比 较 

2. 证明 (28) R5 (30) REM 

3. 对 n=3,n=4, 求 出 由 (32) 式 给 出 的 Mood 统计 量 以 及 由 (33) 式 给 出 的 Hollander 统 
计量 的 精确 分 布 . 

4. 证 明 由 (32) 式 所 给 出 的 Mood 统计 量 的 均值 是 mA(N+1)(N- 1) /12. 
Siegel 和 Tukey(1960) 给 出 了 等 方差 的 另 一 个 检验 ， 对 X 和 Y 的 合并 样本 进行 排序 ， 给 最 
小 的 值 赋 以 秩 1， 给 最 大 的 值 赋 以 秩 2， 给 第 二 大 的 值 赋 以 秩 3， 给 第 二 小 的 值 赋 以 秩 4， 
给 第 三 小 的 值 赋 以 秩 5， 等 等 ， 交 蔡 地 给 两 边 的 各 两 个 值 赋 秩 ( 在 第 一 次 后 ) ， 一 直 进行 
到 中 间 ， 检 验 统计 量 是 赋 给 样本 X 的 秩 和 | 
(a) 说 明 当 两 个 总 体 同 分 布 时 ， 表 A7 对 统计 量 是 有 用 的 . 
(b) 对 于 单 边 备 择 假设 Var(X) > Var( Y), MAAMA (ERA) 的 临界 域 ? 
(c) 用 极端 的 例子 来 说 明 当 两 个 总 体 的 均值 相差 很 远 时 ， 这 个 检验 几乎 没有 功效 

6. 如 果 用 得 分 a(i) 来 计算 (5.2.19) 式 中 定义 的 下 统计 量 , 证 明 结果 可 以 简化 为 如 下 形式 . 

p- TD/(k-1) 
N-1-T)/(N-h 
其 中 , T, 由 (28) RA (30) 式 给 出 ， 注 意 ， 这 个 数学 关系 式 对 所 有 类 型 的 得 分 都 成 立 ， 
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相关 性 度量 是 一 个 用 于 由 数 对 组 成 的 数据 情形 中 的 随机 变量 ， 如 二 维 数据 . 
假设 一 个 容量 为 n 的 二 维 随机 样本 为 (X,Y ) (X ) (Xn Yn), WP R 
(K, Y;) 时 ， 我 们 将 用 (X Y): El XJi=1,- , n,(X,,Y,) 有 相同 的 二 维 分 布 ， 并 
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和 (X,Y) 的 二 维 分 布 相 同 . 

二 维 随机 变量 的 例子 ， 如 XX, 代表 第 i 个 人 的 高 度 ，Y, 代表 他 父亲 的 高 度 ， 或 者 
X, 代表 第 i 个 人 的 测试 成 绩 ，Y, 代表 她 的 训练 量 . 

习惯 上 ， 可 接受 的 X 和 YY 之 间 的 相关 性 度量 应 该 满足 下 面 的 要 求 . 

1. 相关 性 度量 应 该 假设 其 值 只 在 -1 到 1 之 间 . 

2. W X KEFA Y 的 大 值 配 对 ， 并 且 XX 的 小 值 倾向 于 和 YY 的 小 值 配 
对 ， 则 相关 性 度量 应 该 是 正 的 ， 如 果 趋 势 很 强 时 ， 则 接近 于 +1.0， 那 么 ,我 们 称 
和 YY 之 间 正 相关 . 

3. 如 果 义 的 大 值 倾向 于 和 YY 的 小 值 配 对 ， 并 且 XX 的 小 值 倾向 于 和 YY 的 大 值 配 
对 ， 那 么 相关 度量 应 该 是 负 的 ， 如 果 趋 势 很 强 时 ， 应 接近 于 -1.0， 那 么 ,我 们 称 X 
和 YY 之 间 负 相关 . 

4. WÈ X AEA Y 的 值 看 上 去 是 随机 配对 的 ， 则 相关 性 度量 应 该 接近 于 零 ， 这 
大 多 数 应 该 是 X 和 YY 独立 时 的 情形 ， 可 能 也 有 些 X 和 Y 并 不 独立 的 情形 ， 这 时 我 们 
称 X 和 YY 不 相关 ， 或 者 是 没有 相关 ,或 者 有 和 零 相关 . 

最 常用 的 相关 性 度量 是 Pearson 乘积 矩 相 关系 数 ， 记 为 >， 它 定义 为 

z (X, — X)(Y; — Y) 
ra 一 一 (1) 
P 区 xy > Y- yf 
其 中 , 六 和 YY 为 样本 均值 ， 见 2. 2 节 所 定义 ， 用 于 计算 的 较 简 单 形 式 是 
SY X; Y, — nXY 
i=] 


U 
— 
ti 


(2) 


TET 
[2 x- (S Y? — nY?) 
i=] i=] 
如 果 (1) 式 的 分 子 和 分 母 同 除 以 x， 则 + 变 为 
15 G, — XY, — Y) 
i=1 : (3) 


š lra n 1 
> (e=: xy]: > 0- w) 
这 可 能 容易 记忆 ， 因 为 样本 协 方差 是 分 子 ， 两 个 样本 标准 差 的 乘积 是 分 母 . 
Pearson r 是 X 和 YY 之 间 线 性 关系 强度 的 度量 ， 这 意味 着 如 果 Y 对 X 的 散 点 图 ， 
显示 点 (X,Y) 都 落 在 或 接近 于 一 条 直线 时 ， 那 么 ,+ 将 等 于 或 接近 于 +1.0， 这 里 
+1.0 和 -1.0 视 直线 的 斜率 为 正 或 负 而 定 . 
除了 度量 尺度 至 少 是 区 间 的 外 ，Pearson r 比较 难以 解释 、 尽 管 这 样 ， 这 个 相 
关 性 度量 可 用 于 任意 的 数值 型 数据 ， 没 有 任何 度量 尺度 或 基础 分 布 的 要 求 ， 这 就 
迎合 了 可 接受 相关 度量 的 必要 要 求 . 然而, r 是 随机 变量 ， 因 而 有 分 布 函数 .不 幸 
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的 是 ,，r 的 分 布依 赖 于 (X,Y) 的 二 维 分 布 . 因此 ,除非 (X,Y) 的 分 布 已 知 ， 作 为 非 
参数 检验 的 检验 统计 量 或 者 在 构成 置信 区 间 时 , r 没有 太 大 的 价值 . 

除了 这 个 广泛 被 接受 的 r 外， 也 发 现 了 其 他 满足 上 述 可 接受 要 求 的 相关 性 度量 . 
Kruskal ( 1958 ) 的 一 篇 非常 优秀 且 可 读 的 综述 文章 讨论 了 很 多 相关 性 度量 .如 果 XX 和 
Y 是 独立 的 ， 则 一 些 相关 性 度量 有 分 布 函 数 ， 且 它们 不 依赖 于 (X, Y) 的 二 维 分 布 
函数 ， 因 此 ， 它 们 可 以 用 作 非 参数 独立 性 检验 的 检验 统计 量 . 这 里 选择 表达 的 相关 
性 度量 是 赋 给 观测 值 秩 的 函数 . 如果 X 和 YY 是 独立 且 连 续 的 ， 则 它们 的 分 布 函 数 和 
(X,Y) 的 二 维 分 布 函数 是 无 关 的 .如 果 数 据 是 须 序 度量 尺度 的 ， 则 它们 甚至 可 以 用 
作 某 些 非 数值 型 数据 的 相关 性 度量 ， 我 们 提出 的 第 一 个 秩 相 关系 数 是 基于 X 和 Y 的 
秩 计算 的 简单 Pearson r. 


> Spearman p 


数据 ”数据 由 样本 容量 为 n 的 二 维 随机 变量 (X,Y ) ,(X,,Y,),…,(X,,Y,) 组 成 . 
记 R(X,) A X, 与 其 他 XX 值 相 比 的 秩 ，i=1,2,…,n， 即 如 果 X, 是 XX, ,X,,…,X, 中 最 小 
的 ， 则 R(X,) =1， 如 果 X, 是 XX ,X,,…,X, 中 第 二 小 的 ， 则 R(X,) =2, FF, Fk n 8 
RARA X. 类 似 地 ， 记 R(Y,) 等 于 1,2,…，, 或 n， 它 依赖 于 对 每 个 i,Y; SY, 
Yap, Y, 相 比 的 相对 大 小 . 

或 者 ， 如 果 观 测 可 用 刚 描述 的 方式 排序 ， 则 数据 可 以 由 n 对 非 数 值 的 观测 组 成 . 
排序 可 以 是 基于 观测 的 质量 (“最 差 ” 观 测 或 “最 好 ”观测 ) ， 或 者 根据 对 观测 的 喜 
好 程度 ， 等 等 . 

像 Mann-Whitney 和 Kmskal-Wallis 检验 一 样 ， 在 有 结存 在 的 情况 下 ， 给 每 个 有 
结 的 值 赋 以 没有 结 时 本 应 赋 给 它们 的 秩 的 平均 值 . 

相关 性 度量 ”Spearman (1904 ) 给 出 了 相关 性 度量 ,经常 记 它 为 p(rho)， 定义 
WF: 


$ roor) -n (H) 
=— — “— C (4) 


(Esas er 


这 是 基于 秩 与 平均 秩 计算 的 简单 Pearson r. 
如 果 没 有 结 ， 一 个 等 价 而 计算 简单 的 形式 给 出 如 下 : 


R(X) — R(Y)] 
6$ RX) (Y)] ë 


els n(n — 1) "1 eD (5) 


其 中 ,，T 代 表 整 个 分 子 的 求 和 ， 这 个 形式 仅 在 没有 结 时 等 价 ， 如 果 有 很 多 结 时 ， 则 用 
(4) 式 ， 如 果 在 数据 中 出 现 了 中 等 个 数 的 结 ， 因 为 (4) RA (5) 式 之 间 的 差别 很 
小 ， 则 推荐 使 用 计算 简便 的 (5) A. 
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正如 我 们 所 说 ，Spearman p 仅仅 是 又 将 观测 值 换 为 它们 的 秩 ， 然 后 基于 秩 用 
Pearson r 计算 得 到 的 ， 这 从 下 面 的 计算 可 以 看 到 . 如 果 数 据 用 它们 的 秩 代 兰 ， 则 六 


和 Y 对 应 于 
RX 2s x aS ._ln(n+1) 
R( )= 7 R( i) na’ n 2 


= (6) 


和 


(7) 
所 以 (2) 式 变 为 (4) 式 . 

例 5. 4. 1 

测量 12 个 MBA 研究 生 的 入 学 考试 GMAT 分 数 和 他 们 读 MBA 项 目 时 的 平均 成 绩 
(GPA), IIR GMAT 和 GPA 分 数 之 间 的 关系 强度 .他 们 的 GMAT 成 绩 和 GPA 


如 下 给 出 ， 并 附带 有 秩 和 一 些 计 算 . 
学 生 GMAT(X) GPA(Y) RX) RY) [R(X) — RF 


1 710 4.0 14 11.5 0.25 
2 610 4.0 9.5 11.5 4 
3 640 3.9 11 10 | 
4 580 3.8 8 9 1 
5 545 39 3 8 25 
6 560 3.6 5 7 4 
7 610 3.5 9.5 5 20.25 
8 530 3.5 1 5 16 
9 560 3.5 5 5 0 
10 540 3.3 2 3 1 
11 570 3.2 7 1.5 30.25 
12 560 3.2 5 1.5 12.25 
因为 有 一 半 的 观测 都 有 结 ， 所 以 应 该 用 (4) A. 
12 12 
> [R(X)}? = 647.5 [R(Y) = 647 
i=1 i= 
由 引 理 1.4. 2， 在 没有 结 时 ， 它 们 等 于 n(n+1)(2n+1)/6 =650. 而 且 
12 
> R(X)R(Y;) = 589.75 (8) 
i=1 
将 上 面 的 结果 代 人 (4) 式 ， 有 
2 
589.75 — 12 (3) 


= 0.5900 (9) 
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为 了 比较 ，(5) 式 给 出 
ysis TZ = 0.5979 (10) 

它 比 精确 的 p =0. 5900 稍微 大 一 点 ， 差 别 是 因为 在 有 结 时 用 了 平均 秩 . 

有 兴趣 的 一 点 是 基于 原始 数据 计算 的 Pearson r 是 r=0.6630， 在 这 种 情况 下 ，X 
A Y ZERRE T HE X RM Y 的 秩 之 间 更 强 的 线性 关系 . = 
假设 检验 Spearman 秩 相 关系 数 经 常用 作 两 个 随机 变量 之 间 独 立 性 检验 的 检验 统计 
量 ， 见 上 面 给 出 的 Spearman p 的 数据 一 节 ，(4) 式 给 出 了 检验 统计 量 . 
零 分 布 “ 当 X 和 Y 独 立 ,nm<30， 且 没有 结 时 ，p 的 精确 分 位 数 可 由 表 Al0 给 出 .对 
于 较 大 的 n,， 或 者 有 很 多 结 ,p 的 P- 分 位 数 近 似 由 下 式 给 出 

Zp 
ET 

其 中 ，z, 可 在 表 Al 中 查 到 ， 它 是 标准 正 态 分 位 数 . 
假设 Spearman p 对 某 些 类 型 的 相关 不 敏感 ， 所 以 最 好 明确 我 们 所 要 检测 哪 种 类 型 的 
相关 ， 因 此 ， 假 设 有 以 下 形式 ; 
A. (双边 检验 ) 

Ho: X, 和 Yi 互相 独立 

H): 或 者 (a) 较 大 的 X 值 倾向 与 较 大 的 Y 值 配对 , 或 者 (b) 较 小 的 X 值 倾向 与 较 大 的 

Y 值 配对 

如 果 p 的 绝对 值 |p|， 大 于 它 的 1 - av2 分 位 数 〈 分 位 数 可 以 从 表 A10 或 (11) 

式 得 到 ) ， 则 以 水 平 a 拒绝 有 H,， 且 近似 的 双边 p- 值 是 (使 用 表 AL): 
六 - 值 =2.P(Z >|o| Vn — 1) (12) 


(11) 


B.( 负 相关 左边 检验 ) 
Ho: X; AI Y; 互相 独立 
Hi: 较 小 的 X 值 倾向 与 较 大 的 Y 值 配对 , 并 且 较 大 的 X 值 倾向 与 较 小 的 Y 值 配对 
如 果 p < -w _ (w .可 以 从 表 Al0 或 (11) 式 得 到 ) ， 则 以 水 平 a 拒绝 Ho 近似 的 
左边 p- 值 是 (使 用 表 Al ) : 
p- 值 = P(Z <pVn - 1) (13) 
C.( 正 相关 右边 检验 ) 
Ho: X; 和 YY 互相 独立 
Hi: 较 大 的 X 的 值 倾向 与 较 大 的 Y 值 配对 
如 果 p> w ，(w .可 以 从 表 A10 或 (11) 式 得 到 ) ， 则 以 水 平 a 拒绝 H, WWA 
的 右边 p- 值 是 (使 用 表 AI): 
p- 值 = P(Z 2 pVn 一 1) (14) 
计算 机 辅助 ”Minitab,S-Plus,SAS 和 StatXact 可 以 计算 Spearman p， 并 作 独 立 性 检验 . 
这 些 和 其 他 程序 都 会 将 数据 转换 为 秩 ， 并 用 秩 计算 Pearson r， 在 有 结存 在 时 ， 它 会 
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自动 校正 ， 一 一 中 
例 5. 4. 2 
让 我 们 继续 例 5. 4. 1 假设 例 5.4. 1 中 的 12 个 MBA 研究 生 是 所 有 近期 MBA 研究 生 
的 随机 样本 ， 我 们 想 知道 是 否 有 GPA 高 的 学 生 ， 他 的 GMAT 成 绩 也 高 的 趋势 . 则 
= Bi E 
Ho: GPA 和 GMAT 成 绩 互相 独立 

感 兴 趣 的 备 择 假设 是 

Hi:GPA 高 的 学 生 , 他 的 GMAT 成 绩 也 高 
这 和 右边 检验 的 假设 C 相符 合 ， 因 此 ， 如 果 p 超过 它 的 0. 95 分 位 数 ， 就 以 水 平 a = 
0.05 拒绝 H,， 由 于 有 大 量 的 结存 在 ， 则 在 表 A10 中 , = 12 的 分 位 数 wow =0. 4965 
只 是 近似 值 ， 正 态 近 似 值 


wo 95 = = 0.4960 


也 几乎 是 一 样 的 ， 但 可 能 较 精确 . 
观测 到 的 p 值 是 0. 5900， 所 以 我 们 可 以 安全 的 断言 ， 近 期 的 MBA 研究 生 的 
GPA 和 GMAT 成 绩 之 间 有 正 相 关 . 从 (14) R, p- 值 可 近似 为 : 
p 值 = P(Z > 0.5900 V11) = P(Z >1.9568) = 0.025 | = 
接 下 来 我 们 要 提出 与 Spearman p 类 似 的 相关 性 度量 ， 它 是 基于 观测 的 排序 
( 秩 ) 而 不 是 数值 本 身 ， 如 果 X 和 YY 独立 且 连 续 时 ， 这 个 度量 的 分 布 将 不 依赖 于 
X 和 Y 的 分 布 ， 这 个 度量 称 为 Kendall 7 (tau), ZAA È tE Spearman p 更 难 计 
W. Kendall 7 的 主要 优点 就 是 它 的 分 布 能 非常 快 地 接近 于 正 态 分 布 ， 使 得 当 X 
和 YY 独立 的 零 假设 为 真 时 ，Kendall + BJ IE Z š i£ IK, Spearman p 的 要 好 . Kendall 
r 的 另 一 个 优点 是 它 的 解释 直接 而 简单 ， 可 根据 观测 协调 和 不 协调 的 对 的 概率 来 
解释 ， 它 们 将 在 下 面 定 义 ， 


p Kendall + 


数据 ”数据 可 以 由 一 个 容量 为 的 二 维 随机 样本 (X, Y), i=1, 2, +, n 组成. 
两 个 观测 称 做 是 协调 的 (concordant) ， 如 果 一 个 观测 的 两 个 元 素 都 比 它们 对 应 的 为 
一 观测 的 元 素 大 ,例如 (1.3,2.2) 和 “(1.6,2.7). ië Ne. 为 协调 观测 的 对 数 ， 它 是 


naf) 可 能 对 的 一 部 分 ， 一 对 观测 称 做 是 不 协调 的 《discordant) ， 如 果 一 个 观测 的 
两 个 数 与 它们 对 应 的 另 一 观测 的 数 大 小 反 向 (相应 的 差 值 一 个 为 正 ， 一 个 为 负 ) ， 例 
如 (1.3,2.2) 和 (1.6,1.1). JEN, 为 不 协调 观测 的 对 数 ， 元 素 之 间 各 自 有 结 的 对 
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的 情形 ， 按 下 面 在 有 结 一 节 讨 论 的 来 计数 ， 由 于 mn 个 观测 可 能 有 |[ )] =n(n-1)/2 种 


不 同 的 方式 配对 ， 协 调 对 个 数 N.， 不 协调 对 个 数 N,， 与 带 有 结 的 对 数 之 和 将 等 


Tn(n-1)⁄2. 
如 果 观 测 可 以 使 得 刚 描 述 的 N. 和 N. 能 计算 ， 则 数据 也 可 以 由 n 对 非 数 值 观 
测 组 成 . 
相关 性 度量 Kendall (1938) 提出 的 没有 结 的 相关 性 度量 如 下 : 
Ne 一 N 
ro as 


如 果 所 有 的 对 都 是 协调 的 ， 则 Kendall 7 等 于 1.0. 如 果 所 有 的 对 都 是 不 协调 的 ， 则 
值 为 -1.0. 作为 相关 性 度量 ，Kendall 7 满足 本 节 一 开始 的 要 求 . 

# ”用 更 精确 的 语言 描述 ， 如 果 (Y,-Y,)/(X, - X.) 大 于 0， 则 一 对 二 维 观测 
(X,,Y,) A (X,,Y,) 认为 是 协调 的 ;如果 它 小 于 0， 则 认为 是 不 协调 的 .如 果 X, = 
X,， 分 母 为 0， 所 以 不 作 比 较 . 然而 ,如果 Y, = Y, (HX = X,), EE (Y-Y) 
(X, ~X,) 是 0， 在 这 种 情形 下 ， 这 个 数 对 应 该 计数 为 1/2 协调 和 1/2 不 协调 . 这 时 7 
的 分 子 并 没有 什么 差异 ， 因 为 当 计算 N. - Ns 时 1⁄2 项 相抵 消 ， 然 而 ， 它 使 得 有 结 时 ， 
计算 7 的 方式 不 同 了 . 

在 有 结 时 ， 我 们 可 以 用 


N. — Na 
TN. +N, (16) 


这 里 将 所 有 X, X, 的 对 (X,,Y,) 和 (X,Y) 进行 比较 ， 这 一 形式 的 Kendall + 有 这 
样 一 个 优点 ， 即 使 有 结 时 也 可 以 得 到 + 1 或 — 1. Goodman 和 Kruskal (1963) 首先 对 
它 进行 了 讨论 ， 有 时 也 把 它 叫 做 y 系数 (gamma coefficient). 

总 的 来 说 ， 


Y, =: Y; 
nR 
Tek 
x. xx 0, ,给 Ni 加 1( 不 协调 ) 

Ten 

i ee X 0, 给 N. 和 N 各 加 172 

如 果 X; = He 不 作 比 较 ， 

如 果 根 据 X 值 的 增 大 将 观测 (X,Y) 排 在 一 列 上 ， 则 7 的 计算 就 会 被 简化 ， 那 
么 每 个 Y 就 只 与 它 下 面 的 值 进 行 比较 ， 且 协调 与 不 协调 的 个 数 也 就 容易 确定 了 ， 而 
且 每 对 观测 只 考虑 一 次 ， 这 个 方法 在 下 面 的 例子 中 给 予 解释 . 


> 0, 给 Ne 加 1( 协 调 ) 


如 果 
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例 5. 4.3 
我 们 还 利用 例 S. 4. 1 中 的 数据 来 解释 ， 根 据 和 X 值 的 增 大 将 数据 (X,Y) 排列 如 下 . 
协调 对 不 协调 对 
Xi, Y; (Xi Yi) 之 下 (X; Yi) 之 下 
(530, 3.5) 7 4 
(540, 3.3) 8 2 
(545, 3.7) 4 5 
(560, 3.2) 5.5 0.5 
结 [sm 3.5) 4.5 1.5 
(560, 3.6) 4 2 
(570, 3.2) 5 0 
(580, 3.8) 3 1 
(610, 3.5) ? 0 
结 ki 4.0) 0.5 1.5 
(640, 3.9) 1 0 
(740, 4.0) 
N, = 44.5 N; = 17.5 
Kendall + 由 下 式 给 出 
_N 一 Ni 44.5 — 17.5 _ 
FS APA N. 454 175 U 
如 Kendall + 所 度量 的 ，GMAT 成 绩 和 GPA 之 间 有 正 的 秩 相 关 . El 


假设 检验 ”Kendall + 也 可 以 用 做 检验 X 和 Y AEA vy ËJ R tE, Anf 
Spearman p 所 描述 的 那样 ， 使 用 可 能 的 单 边 或 双边 备 择 .一 些 算法 或 许 保留 ， 然 而 ， 
我 们 可 直接 用 N. - N, 而 不 需要 除 以 n(n -1)/2 作为 检验 统计 量 来 获得 r， 因 此 用 了 
作为 Kendall 检验 统计 量 ， 这 里 了 定义 为 
T = N, — Ni (17) 
见 上 面 给 出 的 Kendall + 数据 一 节 ， 在 没有 结 或 结 很 少时 , 用 (17) 式 给 出 的 检验 统 
计量 给 出 ; 如 果 结 很 多 ， 则 应 该 用 (16) RAH r. 
零 分 布 XAY, ms<60， 且 没有 结 时 ，r 和 了 的 精确 上 侧 分 位 数 由 表 All 给 
出 ， 下 侧 分 位 数 是 这 个 表 给 出 的 上 分 位 数 的 负数 . 对 于 较 大 的 n, 或 者 有 很 多 结 ,， 7 
的 分 位 数 近 似 表 示 如 下 : 
wy = Z V2Qn +5) 
p "3 Vn(n — D) 
其 中 ，z, 是 标准 正 态 随机 变量 的 p 分 位 数 〈( 在 表 Al 中 给 出 ). 了 的 p 分 位 数 近似 表 
示 如 下 : 


(18) 


wp = ZpV n(n — 1)(2n + 5)/18 (19) 
假设 
A. (双边 检验 ) 
Ho:X 和 Y 独立 
Hi: 观测 对 倾向 于 或 者 协调 , 或 者 不 协调 
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MET (或 +) 小 于 它 的 零 分 布 的 a/2 分 位 数 或 大 于 它 的 1 - a/2 分 位 数 (W 
表 A11)， 则 以 水 平 a 拒绝 H, 
双边 p- 值 是 2 倍 的 单 边 p- 值 中 较 小 者 ， 近 似 表示 如 下 
Sr (T + 1)V18 
p(238) = P kars -) Co 


和 
(T — 1)V18 
pifia) = P (2> =) QD) 
其 中 , TET. -的 观测 值 ， 连 续 相关 是 1，Z 是 标准 正 态 随机 变量 ， 它 的 概率 由 表 
Al 给 出 . 


B.〈 左 边 检 验 ) 
Ho: XAI Y 独 六 


Hı: 观测 对 倾 问 于 不 协调 
如 果 T (r) 小 于 它 的 零 分 布 的 a 分 位 数 ( 见 表 All1) ， 则 以 水 平 a 拒绝 H ÆW 
pP- 值 近似 地 由 (20) 式 给 出 


C. (右边 检验 ) 
五 0: X 和 Y 独 立 


Hi: 观测 对 倾向 于 协调 
如 果 T (或 rz) 大 于 它 的 零 分 布 的 1 -a 分 位 数 ( 见 表 Al1)， 则 以 水 平 a 拒绝 H,. 
右边 p- 值 近似 地 由 (21) 式 给 出 . 
计算 机 辅助 Minitab , S-Plus , SAS 和 StatXact 可 以 计算 Kendall r， 并 可 以 作 独 立 性 
检验 . < 
pij 5. 4. 4 
在 例 5. 4. 3 中 Kendall 7 由 先 求 出 下 列 了 值 来 计算 
T = N. — N; = 44.5 — 17.5 = 27 
如 果 我 们 感 兴趣 的 是 用 了 来 检验 零 假设 : 学 生 的 GMAT 成 绩 和 他 或 她 的 GPA 独立 ， 
看 高 的 GPA 是 否 与 高 的 GMAT 成绩 相关 ， 那 么 如 果 T 大 于 ww =24 (在 表 All 中 
获得 ) ， 则 以 水 平 a = 0. 05 拒绝 零 假 设 ， 因 为 了 =27， 则 拒绝 零 假 设 ， 右 边 疡 值 从 
(21) 式 近 似 得 到 . 


pP- 值 = P(T > 27) 
(27 — Dv) 
V12 -11-29 
= P(Z = 1.7829) 
= 0.037 
如 果 我 们 用 (16) 式 给 出 的 z 作为 检验 统计 量 ， 由 于 有 结 ， 结 果 是 类 似 的 . m 
同样 的 数据 用 于 Spearman p 和 Kendall 7 是 为 了 更 好 地 比较 这 两 个 统计 量 ， 可 以 
看 出 ，Spearman p(p =0. 5900) IK Kendall +( ç =0. 4355) <. 然而， 使 用 这 两 个 统计 


=p(z> 


(py 
N 
— 
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量 的 那 两 个 检验 (或 它们 的 等 价 统计 量 ) 得 出 几乎 同样 的 结果 . 前面 的 两 个 陈述 在 
大 多 数 情形 下 都 为 真 ， 但 不 是 全 部 情形 . Spearman p 的 绝对 值 比 Kendall r 大 ， 然 而 ， 
作为 显著 性 的 检验 ， 由 于 在 很 多 情形 下 两 个 产生 几乎 相同 的 结果 ， 所 以 没有 一 个 很 
强 的 理由 让 我 们 喜 欢 一 个 而 不 喜欢 男 一 个 . 


> Daniels 趋势 性 检验 


Daniels( 1950) 通 过 将 度量 ( 称 为 X,) 与 取 度 量 的 时 间 (或 次 序 ) 配对 ， 提 出 用 
Spearman p 作 趋势 性 检验 .假设 闷 相互 独立 ， 零 假设 是 它们 同 分 布 ， 备 择 假设 是 X, 
的 分 布 与 时 间 有 关 ， 使 得 当时 间 增 加 时 ，X 的 度量 趋向 于 变 大 (或 变 小 ). 在 3.5 节 
中 我 们 较 全 面 地 讨论 了 趋势 性 的 概念 ， 提 出 了 Cox 和 Stuart 趋势 性 检验 ， 一 般 认 为 基 
于 Spearman p 和 Kendall 7 的 趋势 性 检验 比 Cox 和 Stuart 的 检验 有 更 好 的 功效 .根据 
Stuart( 1956) ， 当 应 用 到 正 态 分 布 的 随机 变量 ， 且 基于 回归 系数 检验 时 ，3.5 节 中 所 
提 到 的 Cox 和 Stuart 趋势 性 检验 的 渐 近 相对 效率 (A. R. E. ) 大 约 是 0.78 ， 而 在 同样 
的 条 件 下 ， 用 Spearman p 和 Kendall 7 检验 的 A. R. E. Æ 0.98. 但 是 ， 这 些 检 验 并 不 
像 Cox 和 Stuart 检验 那样 可 广泛 应 用 例如， 在 例 3.5.3 中 它们 就 不 适用 ， 而 例 
3.5.2 中 则 适用 .所 以 ,我 们 用 这 个 例子 来 解释 Spearman p 的 趋势 性 检验 .使 用 Ken- 


dall r 检验 的 过 程 是 类 似 的 :一 q 
例 5.4.5 
在 例 3.5.2 中 ,给 出 了 19 年 的 年 降水 量 记录 . 趋势 性 的 双边 检验 包括 
降水 量 YY 

# X, ( 英寸 ) R(X) R(Y) [R(X) zz ROY 
1950 45.25 1 12 121 

1951 45.83 2 15 169 

1952 41.77 3 11 64 

1953 36.26 4 6 4 

1954 45.27 5 13 64 

1955 52.25 6 17 121 

1956 35.37 7 2.5 20.25 
1957 57.16 8 18 100 

1958 35.37 9 2.5 42.25 
1959 58.32 10 19 81 

1960 41.05 11 9 4 

1961 33.72 12 1 121 

1962 45.73 13 14 1 

1963 37.90 14 7 49 

1964 41.72 15 10 25 

1965 36.07 16 4 144 

1966 49.83 17 16 1 

1967 36.24 18 5 169 

1968 39.90 19 8 121 


总 和 1421.5 
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如 果 Spearman p 太 大 或 太 小 ， 则 拒绝 没有 趋势 的 零 假 设 ， 因 为 结 的 个 数 不 多 ， 所 以 
检验 统计 量 由 (5) 式 给 出 . 


T = 5 [R(X) — R(Y)] = 1421.5 
i=1 


aiei l u 6515. 
p=1 19(192 — 1) 1 6840 0.2469 
对 a =0.05, p 的 分 位 数 (n=19， 由 表 A10 给 出 ) 为 ， 
0.975 = 0.4579 
和 
Woo25 = 一 0.4579 


像 以 前 一 样 ， 接 受 H, (12) 式 给 出 近似 的 p- 值 : 
p-f = 2- P(Z > 0.2469 V19 — 1) = 2 - P(Z >1.0475) 
= 2(0.147) 
= 0.294 = 


= Jonckheere-Terpstra 检验 


Spearman p 或 者 Kendall r， 可 以 用 于 几 个 独立 样本 的 情形 来 检验 零 假设 : 所 有 
的 样本 来 自 相同 的 分 布 ， 即 


Ho: Fi(x) = F(x) = + = Fx) 
有 序 的 备 择 假设 : 分 布 在 指定 的 有 序 方 向 上 
Hi: Fi(x) > Fx(z) 过 :有 


至 少 有 一 个 不 等 式 成 立 ， 这 个 备 择 有 时 也 写 为 
Hi: E(Y1) < E(Y>) < : : : < E(YR) 
其 中 ，Y 代表 分 布 函 数 为 F,(x) 的 随机 变量 .注意 ， 这 里 的 数据 集 和 零 假设 都 与 5.2 
节 中 Kruskal-Wallis 检验 相同 ， 然 而 ，Kmuskal-Wallis 检验 对 均值 的 任何 (any) 差异 都 
敏感 ， 而 Spearman p， 或 者 Kendall + 仅 对 上 面 给 出 H, 中 的 特殊 有 序 敏 感 . 当 用 Ken- 
dall r 时 ， 这 个 检验 和 Jonckheere-Terpstra 检验 等 价 ， 这 可 以 在 SAS 和 StatXact 计算 机 程 
序 中 找到 ， 我 们 将 在 下 面 例 3. 4. 6 中 解释 这 个 程序 . 一 
例 5. 4.6 
当 人 年 纪 增 大 ， 眼 睛 会 看 不 清楚 近 处 的 物体 ， 这 是 公认 的 40 岁 以 上 人 的 特征 . 
为 了 看 15 ~30 岁 范 围 的 人 随 着 年 龄 的 增长 是 否 也 失去 了 聚焦 近 物 的 能 力 ， 从 4 个 
年 龄 组 的 每 一 组 中 选择 了 8 个 人 ; 这 4 个 年 龄 组 分 别 为 : 15 岁 左 右 ，20 岁 左右 ， 
25 岁 左右 和 30 FEA. 假设 这 些 人 对 测量 的 特征 来 说 是 来 自 各 自 年 龄 组 总 体 的 
随机 样本 .每 个 人 拿 一 张 印 有 字 的 纸 放 在 右 眼 前 ， 左 眼 被 遮 住 ， 把 纸 移 近 眼 睛 直 
到 这 个 人 称 纸 上 的 字 变 得 模糊 了 ， 对 每 个 人 ,测量 纸 上 的 字 仍 然 清 晰 的 最 接近 眼 
睛 的 距离 . 
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零 假设 是 对 所 有 的 总 体 测量 的 距离 是 同 分 布 的 ， 备 择 假设 是 年 龄 大 的 组 的 测量 
距离 趋向 于 比较 大 ， 根 据 年 龄 组 对 样本 从 1 到 4 编号 . 
Ho: F (x) = F2(x) = Fa(x) = Fa(x) 对 所 有 的 x 


Hı: Fi(x) > Fj(x) 对 某 些 x 和 某 些 i j 
我 们 假设 聚焦 近 物 的 能 力 没 有 随 年 龄 提高 ， 因 此 我 们 可 以 用 稍 简单 的 形式 陈述 零 
假设 . 
接 下 来 ， 记 测量 距离 为 Y (以 英寸 为 单位 )， 为 了 方便 , 样本 自身 做 了 排序 ， 
样本 序号 为 X. 
15 岁 203 253 303 
X Y X y x Y x Y 
1 4.6 2 4.7 3 5.6 4 6.0 
1 4.9 2 5.0 3 5.9 4 6.8 
1 5.0 Š 5.1 3 6.6 4 8.1 
] 5.7 2 5.8 3 6.7 4 8.4 
1 6.3 J 6.4 3 6.8 4 8.6 
1 6.8 2 6.6 3 7.4 4 8.9 
i 7.4 2 7 3 8.3 4 9.8 
i 79 2 8.3 3 9.6 4 11.5 


注意 ， 如 果 最 小 聚焦 距离 Y 的 值 随 着 年 龄 增 大 而 增 大 ， 那 么 Y #l X IFRHH2S, TEH 
Spearman p， 或 者 Kendall r， 因 此 我 们 用 X 有 很 多 结 时 的 右边 检验 ， 同 时 注意 到 ， 
我 们 可 以 用 任意 数值 的 增 序列 来 替换 X=1,2,3 和 4 以 代表 年 龄 组 ， 如 X = 15 ,20 ,25 
和 30， 更 换 后 的 X 值 不 会 改变 p 和 7 的 值 . 

这 些 数 据 的 Spearman p (我 们 省 路 计算 细节 ) Æ p =0. 5680. 5 多 右边 检验 的 近 
似 0. 95 分 位 数 是 1. 6449M31 = 0.2954， 有 利于 有 序 的 备 择 ， 所 以 很 容易 拒绝 零 假 
it. 右边 p- 值 小 于 0. 001. 

基于 入 . =290.5,N, =93.5， 这 些 数据 的 Kendall 7 Æ r =0.5130 (仍然 省 掉 细 
35). Ë was =0. 2056 比较 ， 再 次 表明 以 a =0.05 容易 拒绝 H. AA p- 值 仍 小 于 
0. 001， 这 个 检验 用 Kendall 7 与 Jonckheere (1954a) 和 Terpstra (1952) 介绍 的 方法 
是 等 价 的 ， 尽 管 Jonckheere 的 检验 统计 量 只 是 简单 的 N. (协调 观测 对 的 个 数 )， U“ 
口 理论 ”原则 上 , p 和 7 的 精确 分 布 很 容易 得 到 ， 尽 管 在 实际 中 甚至 对 中 等 的 样本 容 
量 n， 其 过 程 相 当 砚 长 乏味 ， 精 确 分 布 是 在 XX, M Y, 独立 同 分 布 的 假设 下 求 出 的 ， 那 
么 n! 个 X 的 秩 与 Y, 的 秩 配对 的 排列 是 等 可 能 的 .如 本 章 的 前 几 节 ， 分 布 函数 很 容 
易 得 到 ， 因 为 通过 计算 给 出 p 和 r 为 指定 值 时 这 种 排列 的 个 数 ， 然 后 用 这 个 数 除 以 
n! 就 可 得 到 p 和 7 为 指定 值 的 概率 . 

因为 p 与 了 都 是 基于 随机 变量 的 和 ， 所 以 可 应 用 中 心 极限 定理 得 到 大 样本 的 近 
似 分 布 ，p 与 7 的 概率 分 布 关于 零 对 称 ， 所 以 它们 两 个 的 均值 都 是 零 ， 而 方差 比较 难 
得 到 ， 这 里 不 打算 推导 . 当 n 很 大 时 , p5 + RAE B 的 标准 差 得 到 的 随机 变量 将 近 
似 于 标准 正 态 随机 变量 ， 对 n 宇 8， 认 为 这 个 近似 对 求 7 的 分 位 数 是 相当 好 的 ， 而 在 
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求 p 的 分 位 数 时 就 不 见得 好 了 . 口 

如 果 (X,,Y;) ,i=1,2,…,n 是 独立 同 分 布 的 二 维 正 态 分 布 随 机 变量 ， 相 对 于 用 
Pearson r 作为 检验 统计 量 的 参数 独立 性 检验 (Stuart,1954)，p 与 7 都 有 渐 近 相对 效 
率 9/m =0. 912. 


p. Kendall 偏 相 关系 数 


偏 相关 的 概念 不 太 容 易 理解 ， 但 为 了 解释 可 以 把 Kendall 7 推广 到 偏 相关 的 方式 ， 
我 们 将 试图 简要 地 描述 一 下 偏 相 关 

对 多 元 随机 变量 (X,X,X), fEX, 和 X, Zh], X, # X, 之 间 等 等 都 可 能 
有 相关 ， 这 个 相关 的 度量 可 以 是 已 经 描述 过 的 任何 一 个 度量 . 这些 度量 估计 的 是 
一 个 随机 变量 对 另 一 个 的 总 影响 (相关) ， 包 括 有 间接 的 影响 ， 因 为 第 二 个 随机 变 
量 不 只 与 第 一 个 随机 变量 相关 ， 而且 可 能 会 和 第 三 个 随机 变量 有 关 ， 而 第 三 个 也 
可 能 又 会 与 第 一 个 随机 变量 有 关 ， 因 此 它 会 在 第 一 个 和 第 二 个 随机 变量 之 间 传 递 
间接 影响 . 

有 时 ， 我 们 要 在 以 某 种 方式 消除 其 他 随机 变量 引起 间接 影响 的 条 件 下 ， 来 度 
量 两 个 随机 变量 之 间 的 相关 ， 当 消除 了 由 X, Xe X, 引起 的 间接 影响 后 ， 作 为 
X, 和 X, 之 间 相 关 的 估计 ， 称 为 “ 偏 ” 相 关 估 计 ， 当 用 Pearson r 进行 推广 时 ， 它 
BORA Tin no MJH Kendall 7 进行 推广 时 ， 记 它 为 To 3e n 

在 n=3 的 简单 情形 下 ， 偏 相关 可 以 用 Pearson 偏 相 关系 数 估计 

ra = -一 二 一 全 二- 一 - (22) 
V(1 — rna- ra?) 

其 中 ,rj 是 通常 在 XX, M X, 之 间 计 算 的 Pearson r， 也 可 以 用 Kendall 侦 相 关系 数 估计 


— 
7123 = —— (23) 
(1 — n — 725) 


其 中 ,7, 是 通常 在 X, # X, 之 间 计 算 的 Kendall r， 可 以 用 Minitab 计算 这 些 偏 相 关 
S$ .— = r rr 

Bartels( 1982) , Chan 和 Tran ( 1992 ) , Cox ( 1966 ) , Dufour ( 1981 ) , Dufour 和 Roy 
(1985),Hallin 和 Melard ( 1988 ) , Hallim et al. ( 1985 ) , Hannan ( 1976 ) , Harel 和 Puri 
(1990) ,Knoke( 1977 ) ,Rao( 1993) ,Sen( 1981) 以 及 Tran ( 1990) 讨论 过 用 秩 相 关 方 法 
(通过 用 秩序 列 相 关系 数 ) 检验 一 系列 观测 的 相关 性 ， 相 关 性 的 秩 检验 比 另 一 受 欢迎 
的 非 参 数 游程 检验 有 更 大 的 功效 . 

与 Kendall 7 中 描述 的 一 样 Spearman p 也 被 推广 来 度量 偏 相关 . 用 Spearman p 
推广 的 一 个 优点 是 求 Pearson 偏 相 关系 数 的 已 有 计算 机 程序 都 可 以 用 秩 来 计算 ， 而 不 
用 数据 ， 因 此 秩 相 关系 数 很 容易 得 到 . 

r,s; 的 分 布依 赖 于 (XX , ,X,) 的 多 元 分 布 函数 ， 因 此 可 能 不 会 用 作 非 参数 检验 
的 检验 统计 量 . T7123 和 pis ;的 分 布 也 依赖 于 多 元 分 布 I 因此 分 布 不 是 自由 的 » 除了 所 
有 3 个 变量 相互 独立 之 外 ， 这 个 主题 的 更 多 内 容 可 参见 Simon( 1977a,1977b) ,Agresti 
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(1977), sk wolfe( 1977b ) Kendall( 1942 ) 给 出 了 偏 秩 相关 的 讨论 . 

对 用 于 另 一 情形 时 ，Kendall 提出 了 另 一 个 相关 性 度量 是 协调 系数 (coefficient of 
concordance)， 当 涉及 更 多 的 变量 时 ， 它 可 以 用 于 度量 总 相关 . 然而 ，Kendall 协调 系 
数 与 Friedman 提出 的 检验 统计 量 之 间 有 着 密切 的 关系 ， 这 建议 我 们 同时 使 用 这 些 统 
计量 ，5. 8 节 中 将 详细 讨论 它 

在 Kendall 和 Gibbons( 1980 ) 的 书 中 包含 了 秩 相关 的 广泛 研究 ， 也 可 参见 Gibbons 
(1993 ) ， 它 包括 了 一 些 Minitab 和 SPSS 的 例子 ，Knight( 1966 ) 给 出 一 个 计算 Kendall 
r 的 计算 机 方法 .Best(1973 ,1974 ) 提出 Kendall 7 的 推广 表格 ， 甚 至 有 n 志 25,， 并 且 
在 有 结 时 不 同情 形 下 的 表 . Stuart( 1963 ) 解释 了 列 联 表 的 Spearman p. Zar( 1972 ) 给 出 
了 Spearman p 更 广泛 的 表 ， 他 用 的 是 一 些 近 似 的 方法 ， 效果 也 相当 不 错 . Iman 和 
Conover( 1978 ) 比较 了 几 种 近似 方法 . Spearman p 的 动态 解释 由 Evans(1973 ) 给 出 

在 回归 分 析 中 ，Hotelling 和 Pabst( 1936 ) ,Konijn( 1961 ) ,Adichie( 1967a ,1967b ) ， 
和 Sen(1968a) 讨论 过 秩 相 关 方法 的 使 用 ， 它 也 是 本 章 下 两 节 的 主要 内 容 ， 其 他 有 关 
秩 相 关 和 相关 性 概念 的 文章 有 Aitkin 和 Hume(1965 ) ,Lehmann( 1966 ) ,Bell 和 Doksum 
( 1967) ,Gokhale( 1968 ) ,Ruymgaart et al. ( 1972) ,Ruymgaart( 1973 ) , Choi ( 1973 ) 以 及 
Shirehata (1975, 1976). Daniel( 1980) 的 参考 文献 中 列 出 了 更 多 的 文献 ， 


习题 
l. 小 俩 口 一 起 去 打 保龄球 ， 将 他 们 所 得 的 分 数列 为 10 行 ， 看 他 们 之 间 的 成 绩 是 否 相关 ， 分 数 是 : 
丈夫 的 妻子 的 丈夫 的 妻子 的 
行 号 分 数 分 数 行 号 分 数 分 数 
1 147 122 6 151 120 
2 158 128 7 196 108 
3 131 125 8 129 143 
4 142 123 9 155 124 
5 183 115 10 158 123 
(a) 计算 . 
(b) 计算 7. 


(c) 用 基于 p 的 双边 检验 来 检验 独立 性 假设 . 
(d) 有 7 来 做 (c) 中 的 问题 . 
2. Fi + 5 p 产生 变化 很 大 的 相关 估计 的 一 个 例子 . 
X; Y, X, Y X Y, 
-8.7 -06 -19 -47 22 38 
-8.3 -08 -16 -55 40 35 
-8.2 -13 -13 -5.6 56 31 
-7.2 -19 -02 -60 59 26 
-6.1 -20 07 46 62 20 
-6.0 -21 13 44 66 12 
-4.1 -40 16 42 67 06 
-2.0 -46 21 39 81 04 
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(a) 作 一 个 粗略 的 散布 图 . 
(b) HA r. 
(c) 计算 p. 
(d) p 或 7 会 导致 拒绝 X 积 7 独立 的 零 假设 吗 ? 
3. 分 配 一 位 新 工人 操作 一 台 机 器 生产 门 门 ， 每 天 抽查 门 门 的 一 个 样本 ， 并 记录 次 品 率 . F 
面 的 数据 说 明 这 个 工人 随时 间 有 显著 的 进步 吗 ? 


天 百分比 天 百分比 天 百分比 
1 6.1 6 6.1 10 4.6 
2 7.5 7 5.3 11 3.0 
3 7.7 8 4.5 12 4.0 
4 5.9 9 4.9 13 3.7 
5 5.2 


(a) 用 Spearman p. 
(b) 用 Kendall 7. 
4. 美国 总 统 第 一 次 举行 就 职 典礼 的 年 龄 和 他 去 世 的 年 龄 有 显著 相关 性 吗 ? 


姓名 就 职 年 龄 ”去 世 年龄 ”姓名 就 职 年 龄 ”去 世 年 龄 
Washington 57 67 Hayes 54 70 
J. Adams 61 90 Garfield 49 49 
Jefferson 57 83 Arthur 50 56 
Madison 57 85 Cleveland 47 71 
Monroe 58 73 Harrison 55 67 
J.Q. Adams 57 80 McKinley 54 58 
Jackson 61 78 T. Roosevelt 42 60 
Van Buren 54 79 Taft 51 72 
Harrison i 68 68 Wilson 56 67 
Tyler 51 71 Harding 55 57 
Polk 49 53 — Coolidge 51 60 
Taylor 64 65 Hoover 54 90 
Fillmore 50 74 F. Roosevelt 51 63 
Pierce 48 64 Truman 60 88 
Buchanan 65 77 Eisenhower 62 78 
Lincoln 52 56 Kennedy 43 46 
A. Johnson 56 66 L. Johnson 55 64 
Grant 46 63 Nixon 56 81 


(a) 用 Spearman p. 
(b) 用 Kendall ç. 
注意 ， 这 些 数据 并 不 代表 随机 样本 ， 但 可 以 假设 他 们 是 所 有 过 去 、 现 在 、 未 来 美国 总 统 
的 随机 样本 
5， 5 名 博士 研究 生 参 加 了 一 次 时 事 考试 ， 博 士 生 的 年 龄 和 考试 成 绩 如 下 . 


f 24 31 38 45 45 
考试 成 绩 68 85 84 92 90 


年 龄 大 学 生 的 考试 成 绩 会 更 高 吗 ? 
(a) 用 Spearman p. 
(b) 用 Kendall 7. 


Yə 
rs 
© 
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6 为 了 看 最 后 一 次 课 和 期 末 考 试 时 间 之 间 留 出 更 多 时 间 是 否 会 趋向 于 提高 学 生 在 期 末 考 试 
中 的 成 绩 ， 将 48 名 学 生 随 机 分 为 4 组 ， 每 组 12 个 学 生 . 第 1 组 在 最 后 一 次 课 的 2 天 后 考 
试 ; 第 2 组 在 最 后 一 次 课 的 4 天 后 考试 ; 第 3 组 给 6 天 时 间 ; 第 4 组 给 8 天 时 间 . 所 有 组 
都 给 了 在 不 同 可 比 条 件 下 的 可 比较 考试 ， 期 末 考 试 成 绩 如 下 . 


第 1 组 第 2 组 第 3 组 第 4 组 
48 71 80 42 70 77 38 73 83 49 77 84 
61 74 82 48 71 81 58 74 87 58 79 93 
67 75 87 62 73 89 70 75 90 73 80 94 
68 79 89 67 75 92 71 79 94 74 84 97 


增长 的 时 间 间 隔 会 趋向 于 提高 考试 成 绩 吗 ? 

7. 由 于 在 低 于 冰点 的 天 气 发 射 后 产生 了 O- 环 故障 ， 挑 战 者 号 航天 飞机 于 1986 年 发 生 了 灾难 性 
爆炸 事故 ， 此前， 火箭 制造 商 Thiokol 公司 的 工程 师 们 就 反对 在 这 样 冷 的 天 气 发 射 ， 因 为 冷 
天 气 会 有 发 生 0- 环 故障 的 危险 ， 他 们 给 出 了 在 这 之 前 24 个 发 射 的 数据 如 下 ， 问 O- 环 事故 
的 次 数 会 随 气温 的 降低 增加 吗 ? 


O- 环 事故 气温 ( 华氏 温度 ) 

没有 66 67 67 67 68 68 70 70 
72 73 75 76 76 78 79 80 8l 

一 个 57 58 63 70 70 

两 个 75 

三 53 


详 见 Feynman( 1988). 
思考 题 


1. 在 没有 结 时 , 证 明 (4) RA (5) RE p 的 等 价 表达 式 . 
2. 对 n=5， 哪 种 秩 的 配对 会 导致 
(a) p=1? (b)r=1? (c)p=-1? (d)7=-1? 
3. 将 思考 题 2 中 的 结果 推广 到 对 于 任意 一 般 的 n, 证 明 p 和 7 事实 上 的 确 假设 了 指定 值 . 


4. 假定 有 人 建议 用 式 子 
> |R(X) — R(Y)| 
EE IL U C A 
Sa (1/4)n? 


它 有 时 称 作 “Spearman's footrule”. 
(a) 在 什么 条 件 下 R=1? (b) 在 什么 条 件 下 R= -1? 
5. 在 n=3 和 通常 独立 性 假设 的 情形 下 ， 求 出 思考 题 4 中 的 p、r #l R 的 精确 分 布 . 
6. 利用 习题 2 中 的 数据 ， 计 算 思 考题 4 中 定义 的 R 在 性 质 上 ，R 能 否 比 7 更 类 似 于 p 吗 ? 


5.5 非 参 数 线性 回归 方法 


对 于 我 们 考查 二 维 随机 变量 (X,Y) 的 一 个 随机 样本 (X,Y ),…, (X,Y,) 来 说 ， 
这 一 节 和 前 面 秩 相关 那 一 节 联 系 紧密 ， 相关 方法 强调 的 是 估计 XX 和 Y 之 间 的 相关 度 ， 
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而 回归 方法 用 于 考查 X 和 Y 之 间 更 紧密 的 关系 .回归 方法 的 一 个 重要 目标 是 ， 我 们 
可 以 从 前 面 的 观测 (X,Y ) 到 (X,Y,) 得 到 信息 的 基础 上 ， 只 知道 XX 时 预测 Y 的 值 . 
例如 ，X 代表 大 学 入 学 成 绩 ，Y 代表 4 年 后 这 个 学 生 的 GPA， 对 过 去 的 学 生 观 测 可 以 
帮助 我 们 预测 将 要 人 学 的 学 生 在 4 年 大 学 内 的 表现 . 当然 ，Y 仍然 是 随机 变量 ， 所 以 
我 们 不 能 期 望 仅 从 知道 与 Y 相关 的 和 的 值 来 决定 Y, 但 知道 XX 应 该 会 帮助 我 们 对 Y 
做 一 个 更 好 的 估计 . 

回归 方法 也 可 用 来 控制 试验 ， 其 中 和 X 可 能 根本 就 不 是 随机 的 ， 但 试验 者 可 能 会 
赋 以 各 种 不 同居 的 值 来 决定 它 对 Y 的 影响 ， 例 如 , 和 可 以 代表 药物 的 被 测 数量 ， 璧 
如 降低 病人 血压 的 药物 .在 一 个 试验 中 ， 可 能 会 挑选 几 种 不 同 水 平 的 X 去 确定 药物 
x Y 的 影响 ，Y 是 病人 的 反应 ， 璧 如 病人 血压 的 降低 . 

形式 上 ,YY 在 XX 上 的 回归 就 是 给 定 X 的 值 x* 时 YY 的 条 件 均值 . 

定义 5.5.1 YY 在 X 上 的 回归 是 E(YIX=x)， 回 妇 方 程 是 y= E(YIX=x). 

如 果 回 归 方 程 已 知 ， 我 们 可 以 用 y 作为 纵 坐标 ,x 作为 横 坐 标 画 图 ， 将 回归 显示 
在 图 上 .但 是 回归 方程 很 少 会 知道 ， 它 是 基于 过 去 的 数据 所 做 的 估计 ， 人 例如， 我们 
想 预测 当 X=6 时 的 Y 值 ， 如 果 知 道 E( YIX =6)， 我 们 就 用 它 作为 Y 的 预测 值 ; 否 
则 ， 我 们 用 几 个 X=6 或 接近 6 时 Y 的 观测 值 的 样本 均值 或 者 样本 中 位 数 来 作 Y 的 预 
测 值 ， 这 时 用 3.2 节 和 5.7 节 中 所 描述 的 方法 就 可 以 形成 E( YIX =6) 的 点 估计 和 置信 
区 间 . 为 了 有 足够 的 观测 使 得 对 于 每 一 个 Xx 的 值 ， 可 以 估计 Y 在 X 上 的 回归 ， 就 需 
要 很 多 的 观测 .对 于 有 几 百 个 或 几 千 个 观测 的 大 数据 集 ， 刚 才 提 到 的 非 参 数 方法 会 
表现 得 很 好 ， 这 是 不 足 为 奇 的 

当 我 们 只 有 很 少 的 观测 数据 ， 且 希望 估计 YY 在 X 上 的 回归 时 ， 这 是 比较 困难 的 
情形 ， 也 正 是 我 们 本 节 要 讨论 的 .知道 一 些 E( YIX=x) 和 x 之 间 的 关系 ,而 且 当 有 
很 少 的 观测 时 能 够 用 这 些 信 息 ， 这 对 我 们 是 很 有 帮助 的 ， 首 先 ， 我 们 将 分 析 E( Y1X 
=x) 是 x 的 线性 函数 的 情形 ， 下 一 节 ， 我 们 考虑 更 一 般 的 情形 ， 即 E( YIX=x) 是 x 的 
单调 (或 者 增 或 者 减 ) 函数 的 情形 . 

如 果 回 归 方 程 的 图 形 是 直线 ， 则 说 Y 在 上 的 回归 是 线性 的 . 

定义 5.5.2 称 Y 在 X 上 的 回归 是 线性 回归 (linear regression) ， 如 果 回 归 方 程 
的 形式 是 

E(Y|X = x) = a + Bx (1) 
对 某 个 常数 a， 称 为 y - AE (intercept), 8 称 为 斜率 (slope). 

通常 ， 常 数 w 和 BB 是 未 知 的 ， 必 须 用 数据 来 估计 ， 如 果 X 和 YY 的 所 有 观测 都 用 
于 估计 a 和 BB， 从 而 实现 了 数据 的 最 大 用 处 ， 同 时 对 每 个 x， 可 以 期 望 一 个 好 的 
E( YIX=x) 估 计 ， 人 们 广泛 接受 的 估计 a 和 有 的 一 个 方法 被 称 为 最 小 二 磁 法 
(least squares method ) . 

定义 5.5.3 在 回归 方程 y=a+Bx 中 ,选择 a 和 8pB 的 估计 a 和 4b， 使 得 最 小 化 
如 下 离 差 平方 和 


[333] 
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SS = 5 [Yi — (a + bX)? (2) 
i=] 


其 中 ， (X,, n E. Y,) 为 观测 , 这 种 估计 方法 称 为 最 小 二 乘法 . 

因为 真正 的 回归 线 可 能 和 观测 很 接近 ， 最 小 二 乘 方法 的 基本 思想 是 回归 线 的 估 
计 应 该 是 和 XX 和 YY 的 观测 值 是 接近 的 . 因此 ， 当 同时 考虑 所 有 的 点 时 ， 选 择 估计 要 
使 得 Y, 和 估计 的 回归 线 之 间 的 垂直 上 距离 忆 很 小 ， 估 计 的 回归 线 在 X; 处 的 值 等 于 a+ 
bX;， 它 可 能 在 Y, 之 上 也 可 能 之 下 ， 我 们 不 能 仅 使 得 D 的 和 小 ， 因 为 即使 估计 的 回 
归 线 根本 不 接近 观测 ，D 的 和 也 可 能 是 零 ， 即 距离 D 的 绝对 值 可 以 很 大 ,但 正 的 DD 
可 以 和 负 的 DD 抵消， 而 其 和 为 0。 为 了 避免 这 点 ， 我 们 选择 最 小 化 D 的 平方 和 : 


ss = $ p? (3) 


其 中 ， 

D; = Y; = (a F bX;) (4) 
这 通常 会 提供 出 一 条 和 数据 吻合 得 很 好 的 直线 ， 所 以 是 真实 回归 线 的 一 个 合理 的 
估计 . 
> 线性 回归 的 非 参 数 方法 


数据 ”数据 是 由 来 自 某 个 二 维 总 体 的 随机 样本 (X,Y ) ,…, (X,Y,) 组 成 . 
假定 条 件 
1. 样本 是 随机 样本 ， 如 果 天 的 值 是 非 随机 量 ， 只 要 Y 是 独立 且 条 件 分 布 相同 ， 
则 这 一 节 的 方法 仍然 适用 . 
2. Y 在 X 上 的 回归 是 线性 的 ， 这 说 明 X 和 Y 都 是 区 间 度 量 尺度 
最 小 二 乘 估 计 最 小 二 乘 方法 提供 了 真正 回归 线 y =a +Bx 的 一 个 估计 ， 
y = a+ bx (5) 


其 中 ,a 和 4b 由 下 式 计算 


和 
a= Y -bX (7) 

其 中 , XA YER ARRE. 
斜率 检验 ”为 了 检验 关于 斜率 的 假设 ， 除 了 假定 条 件 1 和 2 之 外 ， 还 要 加 上 下 面 的 假 
定 条 件 . 

3. “REE” Y — E( YIX)#l X A. 

可 以 采用 Spearman p 检验 下 面 关 于 斜率 的 假设 . 记 代表 某 个 指定 数 ， 对 每 对 
(X,, Y), 计算 Y -BX = U, GES). 然后 根据 5.4 节 所 述 ， 求 出 数 对 (X;,U,) i= 


— 
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1,…,n 的 Spearman HRR% p. K 10 给 出 了 当 H, 为 真 且 没有 结 时 p 的 分 位 数 . 
A. (双边 检验 ) 
Ho: B= Bo 
Hı: B # Bo 
如 5.4 节 所 讨论 的 Spearman p 双边 检验 ， 如 果 p 超过 它 零 分 布 的 1 - a/2 分 位 数 
或 小 于 它 的 a/2 分 位 数 ， 则 以 水 平 a 拒绝 H,. 


B. (左边 检验 ) 
Ho: B = Bo 
Hi: B < Bo 
如 5.4 节 所 讨论 的 Spearman p 左边 检验 ， 如 果 p 小 于 它 零 分 布 的 a 分 位 数 ， 则 
以 水 平 a 拒绝 H,. 
C. (右边 检验 ) 
Ho: B = Bo 
Hi: B > Bo 
hH 5. 4 节 所 讨论 的 Spearman p 右边 检验 ， 如 果 p 大 于 它 零 分 布 的 1 -a 分 位 数 ， 
则 以 水 平 ac 拒绝 H,. 


斜率 的 置信 区 间 ”这 个 方法 也 用 到 假定 条 件 1,2 和 3. 对 每 一 对 点 (X,Y;) 和 (XX,， 
Y,) ,使 得 i<j HB XX,， 来 计算 “两 点 斜率 ” 

Y; — Y, 

X-X, 

记 六 为 所 计算 的 斜率 个 数 ， 对 所 得 到 的 斜率 进行 排序 ， 记 


sss... sN) 


Sij = (8) 


为 排序 的 斜率 . 
为 求 B 的 一 个 1 -a 置信 区 间 ， 我 们 要 找到 was MAR All 中 找到 了 = N. - 
N, 的 1 -ax2 分 位 数 ， 记 > 和 > 为 
r = MN ~ Z-a72) (9) 
s=$(N+wi_ a) +1=N+1-r {10) 
如 果 它 们 不 是 整数 ， 对 r FEARS, Hs AARS, Ne 的 1 -a 置信 区 间 由 区 
间 (3S”,8S”) 给 出 ， 即 
P(S <8 <S®)2>1-a (11) 
计算 机 辅助 ”Minitab 可 以 求 所 有 成 对 斜率 ， 并 容易 得 到 这 个 置信 区 间 . 一 一 一 1 
评注 
与 最 小 二 乘 的 概念 完全 不 同 ， 斜 率 的 置信 区 间 是 基于 Kendall 7+， 尽管 可 能 性 不 大 ， 
但 B 的 最 小 二 乘 估 计 # p 的 置信 区 间 之 外 是 有 可 能 的 ， 这 可 能 会 发 生 ， 例 如 ， 根 据 
其 他 观测 来 判断 ， 当 Y 的 一 个 值 比 我 们 期 望 的 偏离 非常 大 或 非常 小 ， 这 样 的 一 个 离 
群 观测 可 以 将 最 小 二 乘 线 “ 推 ”高 (或 低 ) ， 使 得 线 在 损害 其 他 观测 的 情况 下 更 接近 


Y 
U 
(ea 
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这 一 点 ， 在 这 样 的 情形 下 ， 我 们 选择 一 个 通过 点 (x 的 样本 中 位 数 ,Y 的 样本 中 位 
数 ) ， 斜 率 等 于 由 (8) 式 定义 的 斜率 5, 的 中 位 数 的 线 来 估计 回归 线 更 有 意义 ， 即 ， 
我 们 选择 估计 量 


bi = 5; 的 样本 中 位 数 = Smedian) (12) 
及 
a1 = Yoso — biXoso (13) 
HP, Xost Y, ww 是 样本 中 位 数 . 
例 5.5.1 


我 们 再 次 用 上 一 节 中 的 数据 ， 记 XX, 为 每 个 MBA 学 生 的 GMAT 成 绩 ， 记 Y, 为 毕业 
GPA. 12 个 观测 (X,Y) 是 (710,4.0),(610,4.0),(640,3.9),(580,3.8),(545，, 
3.7),(560,3.6),(610,3.5),(530,3.5),(560,3.5),(540,3.3),(570,3.2) 和 (560, 
3.2). 这 些 点 和 最 小 二 乘 回 归 线 

y = 1.4287 + 0.003714x 
画 在 图 5-1 上 ， 回 归 线 的 确定 是 将 
Sx=7015 X=584.58 > x = 4,129,525 


i=1 

12 12 

Y Y, = 43.2 Y= 3.6 2, XiYi = 25,360.5 

i=1 i=} 
代入 (6) 式 和 (7) 式 ， 即 得 到 了 b = 0. 003714 ,a = 1. 4287， 我 们 可 以 用 回归 线 来 
作为 Y 和 和 X 之 间 关 系 的 描述 ， 或 者 更 确切 地 说 ， 作 为 给 定 X, Y 的 条 件 均值 E(Y! 
X) 的 估计 ， 如 果 一 个 研究 生 的 GMAT 成 绩 是 550， 我 们 可 以 预测 这 个 学 生 的 毕业 
GPA 大 约 是 1.4287 +0. 003714(550) =3. 47 左右 . 由 于 其 他 相关 因素 的 影响 ， 每 个 
学 生 可 能 会 有 更 高 或 更 低 的 GPA ， 诸 如 动机 、 学 习习 惯 和 竞争 义务 . 这 个 回归 线 佑 
计 仅 提供 了 一 个 点 估计 . 

假设 有 一 个 国家 研究 报告 说 “GMAT 成 绩 增加 40 分 导致 GPA 至 少 增加 0.4 . 
因为 斜率 是 Y 的 变化 量 除 以 X 的 变化 量 ， 这 个 报告 等 价 于 说 GPA 对 GMAT 成 绩 的 
回归 线 的 斜率 至 少 是 0. 4/40 =0. 01. 
为 了 看 我 们 12 个 研究 生 的 样本 是 否 和 国家 研究 报告 一 致 ， 我 们 作 如 下 左边 
检验 : 
Ho: 8 >0.01 

对 备 择 假设 Hi: B < 0.01 
像 我 们 计算 的 那样 ， 样 本 斜率 小 于 0.01， 可 以 简单 地 认为 是 偶然 波动 的 结果 ， 并 不 
能 说 明 与 国家 调查 报告 不 一 致 ， 计算 了 GMAT 成 绩 X 和 样本 残 差 U= Y- (0.01) 
X 之 间 的 Spearman p. 
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EE 
500 600 700 


~ GMAT 


图 5-1 12 个 MBA 研究 生 的 GMAT 成 绩 对 GPA 的 
散 点 图 及 最 小 二 乘 回 归 线 


MBA 研究 生 i 

1 2 3 4 5 6 
x 70 610 60 58 545 560 
t= Y A eal -21 -235 -20 -i5 ,=20 
R(X ) {2 9.5 11 8 3 5 
R(u) 1 7 3.5 9.5 12 9.5 

7 8 9 10 11 i 
x 60 530 50 540 570 _ 560 
U=Y-BX -26 -1 -21 -21 -25 -24 
R(X.) 9.5 1 5 2 7 5 
R(U.) 2 11 7 7 3.5 5 


(5.4.4) 式 用 来 计算 p = -0.7273， 它 小 于 表 A10 中 的 零 分 布 的 0.05 分 位 数 ， 所 以 
以 a =0. 05 拒绝 零 假 设 . 由 (5.4.13) 式 ，P- 值 近似 为 
P(Z < -0.7273 V11) = P(Z < —2.4121) = 0.008 
这 个 MBA 研究 生 的 样本 与 国家 调查 结果 不 一 致 . 
为 了 构造 这 个 MBA 研究 生 样 本 来 自 总 体 的 真实 斜率 的 95% 置信 区 间 ， 我 们 计 
算 满 足 X, X, 的 所 有 两 点 斜率 
Y; — Y, 
Xi — X, 
如 图 5-2 所 设计 的 数据 表格 可 方便 地 计算 5;, 共有 N=62 对 (X,,Y,) #l (X,,Y,) 
满足 X, X, ， 如 图 5-2 所 示 . 
对 n=12， 从 表 All 中 可 找到 了 的 0. 975 分 位 数 是 28 ， 所 以 由 〈9) 式 和 “(10) 
式 得 出 ，r=17,s =46.， 从 图 5-2 中 可 找到 5; 的 第 17 个 有 序 值 是 
s^” = 0.00000 


Sij = 


338 
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5; 的 第 46 个 有 序 值 是 
S) = 0.00800 
所 以 ， 真 实 斜 率 B 的 95% 置信 区 间 是 从 0. 000 到 0. 008. 
如 果 由 于 某 种 原因 ， 认 为 最 小 二 乘 回 归 线 是 不 满足 的 ， 则 我 们 找 5; 的 中 位 数 的 
值 ， 它 是 5, 的 第 31 个 有 序 值 0. 1/30 和 第 32 个 有 序 值 0. 4/110 的 均值 ， 即 中 位 数 是 


0. 003485 ， 这 提供 了 8 的 另 一 个 估计 ,正如 (12) 式 所 描述 的 ， 那么 (13) 式 则 提 
IET a 的 估计 ， 


aq = Yoso E b; Xo so = 3.55 — 0.003485(565)= 1.581 


因此 ， 正 如 前 面 评注 中 所 讨论 的 那样 ， 回 归 线 的 另 一 估计 为 : 
y = 1.581 + 0.003485x 


(530, 3.5) |. 00625 0 .00600 —.00750 .00333 0 —.01000 .01333 —.02000 


， (540, 3.3) |. .01000 .00286 .01250 —.00333 .01500 .01000 —.00500 .08000 |(540, 3.3) . 


(545, 3.7) |. .00462 —.00308 .00286 —.02000 —00667 —.01333 —.03333 |(545, 3.7) 
.01600 .00600 .03000 


.01000 0 .01500 


(560, 3.2) |. 
(560, 3.5) |. 


(560, 3.6) |. 
(570, 3.2) |. 
(580, 3.8) 
(610, 3.5) |. 


00800 —.00200 
.02000 .00750 


—.04000 | (560, 3.6) 
(570, 3.2) 


.01000 
.06000 


.00667 —.01000 


(610, 4.0) 
(640, 3.9) |.00143 
(710, 4.0) 
5-2 按 久 的 增加 次 序 排列 点 (X,Y) 的 电子 数据 表格 以 求 5; 的 值 im 
注意 ， 在 前 面 的 例子 中 ， 斜 率 B 的 95 色 置信 区 间 是 从 0.000 #J 0.008, m H #I#E 
绝 零 假设 B=0.01 的 假设 检验 是 一 致 的 ， 这 就 是 通常 的 情形 ; 然而， 在 假设 检验 和 置 
信 区 间 之 间 有 两 个 原因 可 能 会 不 一 致 ， 一 个 原因 是 双边 置信 区 间 是 双边 假设 检验 的 
逆 ， 而 这 里 是 单 边 检 验 ， 另 一 个 原因 是 这 个 置信 区 间 是 基于 Kendall 7 的 假设 检验 的 
逆 ， 而 这 里 假设 检验 是 基于 Spearman p H). 
为 了 更 进一步 解释 ,我们 提出 的 假设 检验 是 在 零 假设 下 X 和 残 差 U = Y -BX 之 
间 秩 相关 的 非 参 数 检验 .对 这 个 检验 ， 我 们 用 Spearman p, 但 是 ， 如 Theil( 1950) 所 
建议 的 ， 我 们 用 Kendall 7 作为 检验 统计 量 也 是 可 以 的 .我 们 选择 Spearman p 是 因为 
它 更 容易 计算 . 
可 以 把 我 们 提出 的 B 假设 检验 倒 过 来 求 8 的 置信 区 间 ， 即 找 出 基于 Spearman p 
双边 检验 中 作为 零 假设 所 有 “可 接受 的 ”BB, 的 值 ， 事实 上 Taylor 和 Conover(1988 ) 
对 这 个 方法 进行 了 研究 ， 并 发 现 会 导致 更 多 的 计算 ， 与 提出 的 基于 Kendall 7 的 方法 
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比较 时 ， 在 效率 上 没有 什么 优点 . 
口 理论 ”为 推导 a fl b, 使 得 (2) RPH SS 最 小 化 ， 我 们 在 括号 里 加 减 一 项 (Y - 
bX) ， 得 到 
55 = > [(Y, — Y) — b(X; — X) + (Y — bX -oy (14) 
i=1 
由 代数 恒等式 | 
(c — d + e)2 = +d? +e — 2cd + 2ce — 2de (15) 
我 们 并 用 c= Y - Y Z, 将 (14) 式 展开 ， 得 
ss = Š (Y, — Y +BY (x, — XP + Š (Y — bX — a) 
i=] i=1 i=l 


-2b (Y; — Y)(X, — X) +2 (Y — bX — a) X (Y; — Y) 
i=1 i=j 
— 2b(Y — bX — a) s (X, — X) (16) 
i=1 


HE Y t X aE 2, XyƏ(Y,- Y) =0 IX (X, -X)=0, (16) 式 中 的 最 后 两 个 和 等 于 
D: 38 

a=Y-bX (17) 
第 3 个 和 达到 最 小 (0) ， 这 给 出 了 a 的 最 小 二 乘 解 ， 剩 下 的 问题 就 是 找 使 得 第 2 个 
和 与 第 4 个 和 达到 最 小 化 的 5b 值 ， 即 最 小 化 


S, — 2bSyy (18) 
其 中 
s, = > (X-X? (19) 
及 
S, = > (X, — XY, — Y) (20) 
i=1 


在 (18) 式 中 ， 加 减 一 项 5:,/5,， 则 第 2 个 和 与 第 4 个 和 是 
Sa Taa Su Sh Sy 
s [2-2 (2) |-2-s 0-2) -F 
当 


和 (21) 
S, 
它 显 然 是 最 小 值 ， 且 与 (6) 式 一 致 ， 注意 ， 这 时 第 2 个 和 与 第 4 个 和 变 成 - S. /S,, 
所 以 平方 和 的 最 小 值 是 : 

So _ 


u T là 
SSmn= D (Yi — Y —— 
i=1 xX 


a-r > (Y, — YY (22) 


342 
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这 里 > 是 由 (5.4.1) 式 给 出 的 Pearson 乘积 矩 相关 系数 注意， 关于 (X,Y) 的 分 
布 我 们 没有 作 任 何 假设 ， 所 以 最 小 二 乘 方法 是 分 布 自 由 的 ， 事 实 上 ， 假 定 条 件 1 和 2 
的 唯一 目的 是 保证 我 们 所 估计 的 回归 线 存 在 . 

在 假定 条 件 3 F, R% 

Y, — E(Y;|X;) = Y; — (e + BX;) (23) 

和 X; 是 独立 的 ， 所 以 5.4 节 中 关于 Spearman p 的 假定 条 件 成 立 . 注意 ，( Y-a- 
BX;) ,i=1 到 nn 的 秩 和 VU,=( Y,~BX,) ,i=1 到 4 的 秩 是 相同 的 ， 所 以 我 们 可 以 在 不 
知道 a 的 情况 下 ,检验 H: B =B,。， 就 像 Spearman p 仅 是 用 秩 来 计算 的 Pearson r — 
样 ， 这 个 检验 类 似 于 在 (X,,U,) 上 计算 ”的 秩 检 验 ， 这 是 通常 检验 同一 零 假 设 的 参 
数 方法 ， 即 是 在 假设 (X,Y) 有 二 维 正 态 分 布下 的 参数 方法 . 在 与 前 面相 同 条 件 以 
K X 的 观测 是 等 间隔 的 条 件 下 ， 根 据 Stuart(1954 ,1956 ) ， 这 个 方法 的 渐 近 相对 效率 
(A. R.E.) 是 (3/x)”=0.98; 对 其 他 分 布 ，A. R. E. 经 常 大 于 或 等 于 0. 95 ( Leh- 
mann , 1975). 

为 了 和 弄 清 斜 率 9 和 Kendall 7 之 间 的 关系 ， 注 意 ， 对 假设 的 斜率 B,， 我 们 有 


i X-X; X, — X; 
m Bos (24) 


其 中 ，U, =Y, -BoX; -a 是 与 假设 回归 线 y =a+pBox 之 间 的 残 差 .依照 (X,U) 
和 “【(X,,U,) 是 协调 或 者 是 不 协调 (在 5.4 节 对 Kendall r 的 讨论 中 描述 过 ) 来 确定 斜 
ESAFE 或 小 于 Bu， 如 果 我 们 用 S, T 的 个 数 来 作 检验 统计 量 ， 决 定 是 否 接 
F H,: B=B,。， 那 么 只 要 不 协调 对 的 个 数 N, 不 是 太 小 或 太 大 ， 我 们 就 接受 Bu， 因为 
N, 和 协调 对 的 个 数 N. 有 下 式 关 系 : 
N. + N = N (25) 
其 中 ,NN 是 总 对 数 ， 而 且 因为 如 果 我 们 有 真实 斜率 和 独立 性 的 假定 条 件 3， 则 表 All 
可 给 出 N. - N, 的 分 位 数 ， 那 么 如 果 N. - N, 大 于 表 All 中 的 w as， 我 们 就 说 N. < 
小 ， 这 也 等 价 于 说 N. 小 于 r= (N- w...) /2， 换 句 话 说 ， 如 果 BB, 至 少 大 于 rr 个 5; 
(或 者 B,>5'")， 则 BB。 是 可 接受 的 .同样 的 讨论 可 给 出 p 的 上 界 ， 从 而 得 到 置信 区 
间 ， 这 个 方法 源 于 Theil(1950) ,Sen(1968a) 把 它 修改 为 处 理 有 结 时 的 情况 . 口 
对 非 参 数 检验 适用 于 几 种 回归 线 的 情形 ， 可 参见 Sen(1972 ) , Adichie ( 1974, 
1975) 和 Pothoff( 1974). Jureckova( 1971 ,1977 ) ,Huber( 1973) 以 及 Hettmansperger 和 
McKean(1977) 给 出 了 其 他 的 估计 回归 系数 的 方法 ，Kalbfleish(1974 ) 讨论 了 非 线 性 
模型 中 的 秩 方法 . 有关 非 参 数 回归 的 更 进一步 讨论 见 Puri( 1985 ) ,Jaeckel( 1972 ) ， 
Hollander 和 Wolfe( 1973) ,Behnen( 1976) 以 及 Stone( 1977). 


习题 
1. 一 名 汽车 司机 记录 了 她 的 行驶 里 程 数 和 她 每 次 加 油 的 加 仑 数 . 
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英里 me 英里 me 
142 11.1 157 12.5 


116 5.7 255 17.9 
194 14.2 159 8.8 
250 15.8 43 3.4 

88 7.5 208 15.2 


(a) 用 加 仑 作 x 轴 ， 作 图 显示 这 些 点 . 

(b) 用 最 小 二 乘 方法 估计 a M b. 

(c) fE (a) 的 图 中 画 出 最 小 二 乘 回归 线 . 

(d) 假设 EPA 以 每 加 仑 18 英里 估计 这 辆 车 的 英里 数 ， 检 验 零 假设 : 这 个 数 适 用 于 这 辆 特 
定 的 车 和 司机 (用 斜率 检验 ). 

(e) 求 出 这 辆 车 和 司机 的 英里 数 的 95% 置信 区 间 . 

美国 学 院 和 大 学 的 学 生 和 教师 人 数 (1973 年 春季 ) 的 一 个 随机 样本 如 下 : 


名 字 学 生 教师 
American International 2546 129 
Bethany Nazarene 1355 75 
Carlow 1019 87 
David Lipscomb 1858 99 
Florida International University 4500 300 
Heidelberg 1141 109 
Lake Erie 784 77 
Mary Hardin Baylor 1063 64 
Mt. Angel 267 40 
Newberry 753 61 
Pacific Lutheran University 3164 190 
St. Ambrose 1189 90 
Smith 2755 240 
Texas Women's University 5602 300 
West Liberty State 2697 170 
Wofford 988 73 


(a) 用 教师 作 x 轴 ， 作 图 显示 这 些 点 . 

(b) 用 最 小 二 生 方 法 估计 回归 线 . 

(c) fE (a) 的 图 中 画 出 最 小 二 乘 回归 线 . 

(d) 检验 假设 : 每 增加 一 名 教师 ， 就 伴随 平均 增加 15 个 学 生 . 

(e) 求 出 斜率 的 置信 区 间 . 

考查 研究 生 院 申请 者 的 一 个 随机 样本 ， 检 验 零 假设 : GRE 语文 成 绩 (Y) 和 GRE 数学 成 


绩 (X) 之 间 的 线性 回归 有 和 斜率 1.0， 备 择 假设 是 斜率 小 于 1.0， 
学 生 数学 语文 学 生 数学 语文 
1 650 540 9 460 510 
2 720 580 10 520 500 
3 580 500 11 740 680 
4 670 570 12 450 600 
5 600 630 13 530 550 
6 510 630 14 570 500 
“j 480 520 15 680 510 
8 610 610 16 740 570 
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4. 一 个 公司 的 共有 股票 的 变化 率 定义 为 它 的 表现 (Y) 与 标准 普尔 500 指数 的 表现 (500 家 
股票 的 一 个 指数 ) 相 比 较 的 斜率 ， 对 最 后 8 个 季度 测量 了 它们 的 表现 ， 试 求 这 个 斜率 的 


95% Ë fä < [a]. 
季度 公司 (X) 标准 普尔 500 指数 ”季度 ”公司 (X) 标准 普尔 500 指数 
1 +45% +2.6% 5  —46% =25% 
2 +51% +2.7% 6 -0.6% +0.1% 
3 +80% +3.1% 7 +10.3% +4.9% 
4 +22% +0.8% 8 +22% +1.0% 


5.6 单调 回归 方法 


5.5 节 中 提出 了 线性 回归 的 非 参 数 方法 ， 这 些 可 以 用 于 如 例 5. 5. 1 的 情形 ， 线 性 
回归 的 假设 看 起 来 是 合理 的 ,但 在 其 他 情形 ， 回 归 函 数 假设 是 一 条 直线 可 能 并 不 合 
理 ， 而 假设 随 着 站 的 增加 ，E( YIX) 也 增加 (至 少 它 不 下 降 ) 可 能 是 合理 的 .在 这 种 
情况 下 ， 我 们 称 回 归 是 单调 递增 的 (monotonically increasing). WRM X KIH E 
(YIX) 减 少 ， 则 称 回归 是 单调 递减 的 (monotonically decreasing). 这 两 种 情形 都 可 以 
用 下 面 的 方法 . 


> 单调 回归 的 非 参 数 方法 


数据 ”数据 是 由 来 自 某 个 二 维 分 布 的 随机 样本 (X, ,Y ),…,(X,,Y,) 组 成 . 
假定 条 件 
1. 样本 是 随机 样本 . 
2. Y 在 X 上 的 回归 是 单调 的 . 
E (YI X) 的 点 估计 给 定 值 X=x。， 估 计 YE X EEA: 
1. 获得 XX 的 秩 R(X,) 和 YY 的 秩 R(Y,)， 有 结 时 用 平均 秩 . 
2. 基于 秩 求 最 小 二 乘 回归 线 . 


y = a> + bx (1) 
其 中 
> R(X)R(Y;) — n(n + 1)°/4 
A ——— (2) 
È [R(X ~ nin + 1)°/4 
i=] 
及 


a, = (1 — b;)(n + 1) /2 (3) 
3. 获得 的 秩 ROx ) 如 下 : 
(a) 如 果 % 等 于 某 个 观测 X. ， 令 R) + X, 的 秩 . 
(b) WR x, 落 人 两 个 邻近 的 值 X 和 Y, E, X, <x < 已， 对 它们 各 自 的 秩 
做 内 插 ， 得 到 RC). 


4. 


nd 
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R(xo) = R(Xi) + 


这 个 “ 秩 ” 不 必 是 个 整数 
(c) WÈ x, JT X WJ NW sk tr K T X 的 最 大 观测 ， 不 要 外 推 ， 因 为 Y 
在 X 上 的 回归 的 信息 只 在 观测 X 的 范围 内 有 效 . 
将 R(xo) 作 为 x 代 人 (1) 式 ， 得 到 相应 值 E( YIX = 如 ) 估 计 的 秩 R(yo )， 
R(yo) = a> + byR(xo) (5) 
通过 用 Y 的 观测 ， 将 R(y,) 转 换 为 (YIX=x。)， 即 E(YIX=a) 的 估计 ， 方 
法 如 下 : 
(a) 如 果 R(yo) 等 于 某 个 观测 Y, 的 秩 ， 令 这 个 估计 (YIX = 如) 等 于 这 个 观 
测 Y. 

(b) 如 果 Ry) KARAR Y, 和 Y, 之 间 (Y, < Y,), #48 R(Y,) < 
R( y) <R(Y,), fE Y, A Y, 之 间 做 内 插 : 
R(yo) — ROY'i) 
R(Y;) 一 R(Yi) 
(c) 如 果 R(y。) 大 于 Y 的 最 大 观测 的 秩 ， 邻 E(YIX =x) EF Y 的 最 大 的 观 
测 值 .如 果 R(y,) 小 于 YY 的 最 小 观测 的 秩 ， 令 (YIX =x) 等 于 YY 的 最 

小 观测 值 . 


X0 一 
j 


X, 
x x RO) - RX) (4) 


É(Y|X = xo) = Y; + (Y; — Y) (6) 


Y 在 世上 的 回归 估计 ”如 刚 描述 的 方法 ， 利 用 所 有 观测 值 来 做 回归 点 估计 ， 为 得 到 
整 条 回归 曲线 ， 我 们 用 下 面 的 方法 . 


1. 
2: 


对 从 三 "到 无” 的 每 个 成 ， 用 前 面 描述 的 方法 估计 E( Y1X). 


对 Y 的 每 个 秩 ，R(Y,)， 从 (1) R, 求 出 X 的 估计 秩 ， R(X,). 
R(X) =[R(Y) — ad/by i=1,2,%,n (7) 


. 用 前 面 第 5 步 的 方法 ， 将 每 个 RCX,) 转换 为 估计 多 ， 确 切 地 说 : 


(a) WR R(X) 等 于 某 个 观测 X 的 秩 ， 令 X, 等 于 这 个 观测 值 . 

(b) 如 果 不 (X,) 落 人 两 个 邻近 值 X 和 X, 的 秩 之 间 (X <X,)， 则 用 内 插 ， 

R(Xi) — R(X;) 

R(X,) — R(X;) 

(c) WE R(X, T X 的 最 小 观测 的 秩 或 大 于 X 的 最 大 观测 的 秩 ， 则 没有 估 
HÊ. 


X, = X, + (X, — X;) (8) 


. 在 图 纸 上 夯 出 在 第 1 步 到 第 3 步 中 求 得 的 每 一 个 点 、 即 ， 画 每 个 (X,, 了 ,) 和 


每 个 (X. Y) .所 有 这 些 点 应 该 是 单调 的 ， 如 果 bp, > 0， 则 递增 ， 如 果 
b, <0， 则 递减 . 


. 将 第 4 步 中 相 邻 的 两 点 用 直线 连 起 来 ， 这 一 系列 连 起 来 的 线段 就 构成 了 在 下 


E BSBIEIHINSR8SISETIE, u————— F.q 
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例 5.6. 1 
研究 17 桶 新 鲜 葡 萄 汁 ， 看 葡萄 汁 要 多 和 久 才 能 变 成 葡萄 酒 ， 并 把 它 作 为 给 计 里 加 多 
WARR 83. 范围 从 0 到 10 磅 不 同 量 的 糖 加 入 到 那些 桶 中 ， 每 天 都 要 检查 那些 桶 ， 
看 是 否 转变 成 葡萄 酒 ，30 天 后 ,试验 终止 ， 有 3 桶 仍 未 发 酵 . 需要 做 Y (直到 发 酵 
的 天 数 ) EX ( 糖 的 磅 数 ) 上 的 回归 曲线 的 估计 

对 于 观测 (Xi;,Y;) ， 由 前 面 的 第 1, 2 和 3 步 可 计算 它们 的 秩 R(X,) 和 R(Y,)， 


t R(Y,), Ý, =Ê(CYIX,) ,R(x,) 1 E Ê.. 


X Y, RX) RY) RY) Y, RX) Å 
0 >30 1 16 16.47 >30 1.50 .25 
25 


5 >30 2 16 15.54 29.54 1.50 

1.0 >30 3 16 14.60 28.60 1.50 25 
1.8 28 4 14 13.67 26.67 3.64 1.52 
» 24 5 13 12.74 22.67 4.71 2.09 
19 6 ; 

5.6 12 10 9.5 8.07 9.13 8.46 4.58 
6.0 6 1l 5 7.13 813 1328 7.50 
6.5 8 12 7 6.20 7.20 1113 6.07 
7.3 4 13 1.5 5.27 6.26 17.03 人 缺失 
8.0 5 14 3 4.33 5.67 1542 901 
8.8 6 15 5 3.40 520 13.28 7.50 
9.3 4 16 1.5 2.46 4.64 1703 k 
9.8 6 17 5 1.53 4.02 13.28 7.50 


Æ 5-3 求 单调 回归 曲线 估计 的 计算 
图 5-3 中 给 出 了 这 些 值 . 在 得 到 R( Y,) ,Y, ,R(X,) 和 久之 前 ， 关 于 秩 的 最 小 二 莱 系 数 可 
从 (2) RA (3) 式 计 算得 到 ， 并 代 人 (1) 式 得 到 关于 秩 的 最 小 二 乘 回 归 线 . 
y = 17.4037 — 0.9337x (9) 
在 图 5-4 中 画 出 了 观测 值 ， 同 时 也 画 出 了 由 连接 相 邻 两 点 (X,,Y,) 和 (X,,Y,) 
的 线段 所 组 成 的 回归 曲线 ， 在 图 54 中 ， 由 横 坐 标 x, 所 对 应 曲线 上 纵 坐 标的 值 就 容 
易 得 到 估计 (YIX =x。)， 注 意 ， 在 秩 回 归 中 用 到 了 “ 删 失 的 ”观测 “>30”, 但 
是 数据 的 回归 曲线 那 部 分 不 可 能 用 普通 的 线性 回归 来 画 
有 趣 的 是 ， 对 一 个 显然 是 非 线 性 回归 曲线 的 观测 数据 集 ， 它 是 如 何 转换 到 看 上 去 
回归 曲线 为 直线 的 秩 回 归 上 去 的 图 5-5 中 画 出 了 这 些 秩 及 其 方程 (9). m 
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5 <a 


| 

| 
站 

0. 1 2 3 4 8 6 7? B 910 


图 5-4 直到 发 酵 的 天 数 (v) 对 糖 的 磅 数 (x), 


以 及 估计 的 单调 回归 曲线 
| 
15 
| 


图 $-5 ROY) 对 RX) 以 及 最 小 二 乘 回 归 线 
口 理论 ”单调 回归 的 方法 是 基于 如 果 两 个 变量 有 单调 关系 ， 那 么 它们 的 秩 将 会 有 线 
性 关系 这 一 基础 的 ， 在 单调 回归 线 附近 观测 点 的 散布 对 应 着 在 秩 线性 回归 线 周 围 秩 
的 散布 ， 秩 作为 转换 变量 ， 所 找 的 变换 将 单调 回归 函数 转换 为 线性 回归 函数 ，E(YI [347 
X) 的 区 间 估 计 可 以 用 2. 2 节 中 描述 的 自助 法 得 到 . O |348 
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Cryer, Robertson, Wright 和 Casady ( 1972), Casady 和 Cryer (1976), ， Hogg 


(1975) 以 及 Iman 和 Conover(1979 ) 比较 和 解释 过 其 他 处 理 单调 回归 的 方法 . 对 这 个 
方法 更 完整 地 阐述 ， 参 见 Iman 和 Conover(1979 ) . 


习题 


1. 


“剂量 -反应 ”曲线 广泛 应 用 于 生物 学 的 研究 和 制药 工业 中 ， 如 下 述 例子 .假设 将 某 种 药 
ñ (X， 以 毫升 度量 ) 用 于 天 等 鼠 ， 看 是 否 有 某 种 特殊 反应 (癌症 ， 糖尿病， 等 等 ) 发 
+. 用 5 只 天 特 鼠 做 试验 ， 每 只 给 几 个 剂量 水 平 的 药物 ， 动物 显示 反应 的 百分比 作为 Y 
变量 ， 记 录 如 下 . 
X (剂量 ) 05 1.0 
Y (反应 百分比 ) 0 0 
(a) 画 出 散 点 图 期望 的 反应 值 看 起 来 是 剂量 的 线性 函数 吗 ? 是 单调 函数 吗 ? 
(b) 在 X=3.0 毫升 处 ,估计 E(Y1 X). 
(c) 在 X=3.3 毫升 处 ,估计 E(Y1 X). 
(d) 估计 Y 在 X 上 的 回归 曲线 ， 将 估计 出 的 回归 曲线 画 在 (a) 的 那 张 图 上 . 
10 个 公司 公布 了 它们 去 年 相 比 于 前 年 的 广告 费用 的 增长 百分比 〈X) ， 和 它们 的 销售 额 增 
长 百分比 (Y). 


15 20 25 30 35 40 45 5.0 
20 0 40 60 40 80 100 100 


公司 
1 2 3 4 5 6 7 8 9 10 
X (广告 ) 4 62 31 -11 47 88 16 -1 74 21 
Y (销售 ) 10 33 39 —14 37 39 18 -8 45 33 
(a) 画 出 散 点 图 ， 期 望 的 销售 额 增长 百分比 的 值 看 起 来 是 广告 费用 增长 百分比 的 线性 函 
数 吗 ? 是 单调 函数 吗 ? 
(b) 对 25% 的 广告 费用 增长 ， 估 计 销 售 额 的 期 望 增长 百分比 . 
(c) 估计 Y 在 X 上 的 回归 曲线 .将 估计 的 回归 曲线 画 在 (a) 的 那 张 图 上 . 
在 确定 地 涯 爆炸 概率 的 试验 中 ， 给 定 某 种 刺激 强度 ， 测 试 17 个 地 雷 ， 给 每 个 地 雷 以 不 同 
强度 的 冲撞 刺激 ， 看 地 雷 是 否 爆炸 .结果 有 8 个 地 雷 爆炸 ，9 个 没有 爆炸 ， 各 自 的 冲撞 刺 


激 强度 如 下 给 出 . 
爆炸 的 10.7, 13.9, 15.8, 17.0, 18.1, 19.9, 20.7, 21.6 
没有 爆炸 的 4.0, 4.4, 4.7, 5.1, 9.3, 11.2, 13.7, 15.0, 19.7 


给 定 冲撞 刺激 强度 为 29， 用 单调 回归 估计 地 雷 爆炸 的 概率 (提示 : 如 果 地 雷 没有 爆炸 ， 
则 令 Y=0， 如 果 地 雷 爆 炸 ， 则 令 Y=1). 


思考 题 


1. 


证 明 E( Y| X) 的 估计 不 可 能 小 于 Y 的 最 小 观测 值 或 大 于 Y 的 最 大 观测 值 . 对 于 习题 1 
和 2 所 描述 的 情形 ， 试 讨论 这 个 性 质 的 优点 和 缺点 ， 

对 习题 1 中 的 数据 求 出 最 小 二 乘 回 归 直 线 . 用 这 个 回归 直线 估计 给 定 X=0.5 训 升 时 Y 的 均 
值 ， 对 你 来 说 ， 这 个 估计 合理 吗 ? 
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5.7 一 样本 或 配对 情形 


这 一 节 的 秩 检验 用 于 处 理 单个 随机 样本 和 配对 随机 样本 ， 当 考虑 差 时 ， 配 对 随机 
样本 就 变 为 单个 样本 ， 事 实 上 ， 一 个 配对 (X,Y) 是 二 维 随 机 变量 的 单个 观测 ，3.4 
节 的 符号 检验 通过 将 每 对 变 为 加 ， 减 ， 或 一 个 结 ， 并 将 二 项 检验 应 用 到 所 得 的 单个 样本 
上 来 分 析 配 对 数据 ， 本 节 的 检验 也 用 下 面 的 差 将 配对 (X, Y) 变 为 单个 观测 . 

D; = Y; — X; j i=1,2, = ,n (1) 
然后 将 D, 作为 单个 观测 进行 分 析 ， 符 号 检验 仅 注 重 D, 是 正 的 ， 负 的 ， 或 零 ， 而 本 节 
的 检验 注重 正 的 D, 相对 于 负 的 D 的 大 小 .本 节 的 模型 类 似 于 符号 检验 中 所 用 的 模 
型 ， 而 且 假 设 也 类 似 于 符号 检验 中 的 假设 ， 符号 检验 和 这 个 检验 之 间 重 要 的 不 同 是 
关于 差分 布 的 对 称 性 (symmetry) 假定 .在 介绍 这 个 检验 之 前 ,我们 应 该 清楚 形容 
词 “ 对 称 的 ”应 用 到 分 布 时 的 意义 ， 并 讨论 对 称 性 对 度量 尺度 的 影响 . 

如 果 分 布 是 离散 的 ， 则 对 称 性 容易 定义 ， 如 果 离 散 型 概率 臣 数 图 的 左 半边 是 布 
半边 的 镜像 ， 则 称 离散 型 分 布 是 对 称 的 例如， 如 果 p =1/2， 则 二 项 分 布 是 对 称 的 
( 见 图 56) ， 而 且 离 散 的 均匀 分 布 总 是 对 称 的 〈 见 图 $-7)， 图 中 的 虚线 代表 分 布 关于 
此 线 对 称 . 

对 不 是 离散 的 分 布 ， 我 们 不 能 画 一 幅 概率 函数 图 .因此 需要 一 个 抽象 的 对 称 性 
的 定义 ， 见 下 面 的 定义 5.7.1. 

定义 5.7.1 对 于 某 个 c， 称 随机 变量 七 的 分 布 是 关于 线 x= c 对 称 的 ， 如 果 对 
每 个 可 能 的 x 的 值 ，X<c -x 的 概率 等 于 X 宇 c+x 的 概率 . 

在 图 56 中 ，c =2， 且 对 所 有 的 实数 x， 这 个 对 称 性 定义 容易 验证 ， 在 图 5-7 中 ， 
c=3.5， 即 使 我 们 不 知道 一 个 随机 变量 的 精确 分 布 ， 但 我 们 经 常 能 说 ,“ 假 设 分 布 对 
称 是 合理 的 . ”这 样 的 一 个 假设 并 没有 正 态 分 布 假设 那么 强 ; 因为 所 有 的 正 态 分 布 都 
是 对 称 的 ， 但 并 不 是 所 有 的 对 称 分 布 都 是 正 态 的 . 

如 果 一 个 分 布 是 对 称 的 ， 则 均值 (如 果 它 存在 ) 与 中 位 数 一 致 ， 因 为 两 个 都 处 
在 分 布 的 中 间 ， 在 对 称 线 处 .给 模型 加 对 称 性 假设 的 一 个 结果 就 是 任何 关于 中 位 数 
的 推断 对 均值 的 推断 也 有 效 . 

给 模型 加 对 称 性 假设 的 第 二 个 结果 就 是 要 求 的 度量 尺度 从 有 序 的 变 为 区 间 的 . 
对 于 次 序 度量 尺度 ， 随 机 变量 的 两 个 观测 只 需要 基于 谁 大 谁 小 来 区 别 ， 不 必要 知 
道 哪 一 个 离 中 位 数 最 远 ， 例 如 ， 当 两 个 观测 在 中 位 数 的 两 边 . 如 果 对 称 性 的 假设 
是 有 意义 的 ， 离 中 位 数 的 距离 就 是 有 意义 的 度量 ， 从 而 ， 两 个 观测 之 间 的 距离 就 
是 有 意义 的 度量 . 所 以 ， 度 量 尺 度 不 仅 是 有 序 的 ， 而 且 它 是 区 间 的 . 

Wilcoxon( 1945) 提出 了 一 个 检验 ， 它 设计 为 检验 一 个 特殊 的 样本 是 否 来 自 一 
个 指定 均值 或 中 位 数 的 总 体 ， 它 也 可 以 用 于 观测 是 配对 的 情形 ， 如 通过 每 个 项 目 
“之 前 ”和 “之 后 ”的 观测 来 看 对 配 中 第 二 个 随机 变量 是 否 和 第 一 个 随机 变量 有 
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相同 的 均值 ， 注意， 在 对 称 分 布 中 ， 均 值 等 于 中 位 数 ， 所 以 这 两 个 术语 可 以 互相 
交换 使 用 . 


1 2 3 
图 5-6 二 项 分 布 的 对 称 性 


f(x) 
x | 
| | 
i | 
1/6 |- 
i | 
| 
1 2 3 4 5 6 
57 ”离散 均匀 分 布 的 对 称 性 
> Wilcoxon 符号 秩 检验 


数据 ”数据 由 n' 个 独立 观测 值 (x ,yi ,(2 ya) (xyv) 组 成 ,其 中 (xi,y;) 是 
二 维 随 机 变量 (X,Y) 的 观测 值 ，i =1,2,…,n'， 求 出 ww' 个 差 D, = Y, - X, (在 一 样 
本 问题 中 ，D 是 样本 的 观测 ， 如 例 5.7.2 中 的 解释 ).， 然后 对 nn' 个 数 对 (X,,Y,) 的 
每 一 数 对 计算 绝对 差 (与 符号 无 关 ) 
ID] =lY,- X| i=- -w (2) 
AES XTER Y22392 (BD X, =Y, 或 者 D, =0) 的 数 对 的 进一步 考虑 ， 令 数 对 的 
个 数 仍 由 闫 来 记 ，m 生灵 ， 根 据 绝 对 差 的 大 小 ， 把 从 1 到 的 秩 如 下 赋 给 这 个 数 对 . 
秩 1 赋 给 绝对 差 |D, | 最 小 的 数 对 (X,Y); 秩 2 赋 给 绝对 差 第 二 小 的 数 对 ， 等 等 ， 
秩 n 赋 给 绝对 差 最 大 的 数 对 . 
如 果 几 个 数 对 的 绝对 差 互 相 相 等 ， 则 给 每 个 数 对 赋 以 本 该 赋 给 它们 秩 的 平均 秩 . 


352| [ 即 如 果 秩 3,4,5 和 6 属于 4 个 数 对 ， 但 是 我 们 不 知道 将 哪个 值 赋 给 哪个 数 对 ， 因 为 
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所 有 4 个 数 对 的 绝对 差 都 相互 相等 ， 那 么 给 这 4 个 数 对 都 赋 以 平均 秩 卫 (3 +4+5 


+6) =4.5 ]. 
假定 条 件 
1. 每 个 也 的 分 布 都 是 对 称 的 . 
2. D, 相互 独立 . 
3. 所 有 D, 都 有 相同 的 均值 . 
4. D, 的 度量 尺度 至 少 是 区 间 的 . 
检验 统计 量 ”对 每 个 数 对 (X,Y,) ， 定 义 符号 秩 ( 记 为 R,) HHF. 
R, = 赋 给 (Xi Yi) 的 秩 , WR D, = Y; — X; 是 正 的 ( 即 ,Y; > X;) 
Ri =R (X; Y) 的 秩 为 负数 , wR D, = Yi 一 Xi; 是 负 的 ( 即 ,Y; < Xi;) 
检验 统计 量 是 正 符 号 秩 的 和 
rE o 


零 分 布 在 D, 有 均值 0 的 零 假设 下 ， 对 没有 结 ， 且 n<50 时 ， 表 A21 给 出 了 T 精确 
分 布 的 下 侧 分 位 数 ， 上 侧 分 位 数 可 从 下 面 关系 式 中 获得 
_n(n+1) 
Wp =—— Wi-p (4) 
如 果 有 很 多 结 时 ， 或 者 如 果 中 >$0， 则 应 当 用 正 态 和 逼近.， 正 态 通 近 要 用 所 有 带 有 
正 或 负 号 的 符号 秩 的 和 ， 以 及 统计 量 


>, R, 
T=- (5) 
> R: 
i=1 
在 没有 结 的 情况 下 ， 根 据 引 理 1. 4.2，(5) 式 可 简化 为 
SR 
i=1 


T = —————ea— (6) 
V n(n + 1)(2n + 1) /6 


了 的 零 分 布 近似 于 标准 正 态 〈 见 表 Al). 
假设 
A. (双边 检验 ) 
Ho: E(D)=0 (BP, E(Y;) = E(X;)) 
Hy: E(D) #0 
WRX (X,,Y,) 有 相同 的 二 维 分 布 ， 那 么 ，H, 可 以 写 为 : E(X)=E(Y). 如 果 
T (或 T) 小 于 它 零 分 布 的 o/2 分 位 数 或 大 于 它 零 分 布 的 1 - ov2 分 位 数 ， 则 以 水 平 a 
拒绝 H,，T? 的 分 位 数 可 在 表 A12 中 获得 . 了 的 近似 分 位 数 可 从 表 Al 中 获得 . 
双边 检验 的 P- 值 是 2 倍 的 单 边 p- 值 中 较 小 者 ,或 者 从 正 态 分 布 近似 
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>R+l 
i 


左边 p- 值 = P [< 


或 者 


> Ri 一 1 
右边 p- 值 = rz> 二 一 | (8) 


B. (左边 检验 ) 
Ho: E(D)>0 (Bp, E(Y;) = F(X;)) 
Hi: E(D) < 0 
WRR (X,,Y,) 有 相同 的 二 维 分 布 ， 那么 ，H, 可 以 写 为 E(Y) < E(X). 如 
RT? (RT) 小 于 它 零 分 布 的 a 分 位 数 ( 对 于 7T*， 分 位 数 可 从 表 A12 中 获得 ; 对 
于 T， 分 位 数 可 从 表 Al 中 获得 ) ， 则 以 水 平 a 拒绝 H 近似 左边 p- 值 的 由 (7) 式 
给 出 
C. (右边 检验 ) 
Ho: E(D)<0 (EP, E(Y;:) < E(X;)) 
Hy: E(D)> 0 
如 果 数 对 (X,Y) 有 相同 的 二 维 分 布 ， 那么 ，H) 可 以 写 为 : E(Y) > E(X). 
如 果 T (或 T) 大 于 它 零 分 布 的 a 分 位 数 (对 于 了 ， 分 位 数 可 从 表 A12 中 获得 ， 
对 于 T， 分 位 数 可 从 表 Al 获得 ) ， 则 以 水 平 a 拒绝 H. 近似 右边 p-fB H (8) 
式 给 出 . 
计算 机 辅助 ”Minitab, S-Plus, SAS 和 StatXact 含有 作 Wilcoxon 符号 秩 检 验 的 
TE J$: a=; — — s n s 
例 5.7. 1 
给 12 组 双胞胎 做 心理 检验 ， 以 测量 每 个 人 的 进取 心 ， 我 们 感 兴趣 的 是 对 双胞胎 进 
行 比 较 ， 看 第 一 个 出 生 的 是 否 倾 向 于 比 另外 一 个 更 有 进取 心 ， 结果 如 下 ， 高 分 显示 
更 多 的 进取 心 . 
双胞胎 组 
1 2 3 4 5 6 7 8 9 10 11 12 


第 一 个 出 生 X 86 71 77 68 91 72 
第 二 个 出 生 Y 88 77 76 6 9 72 
£ D. +2 +6 -1 -4 +5 0 
ID,| 的 秩 3 7 15 4 55 — 10 15 55 9 8 11 
R, 3 7 -15 -4 55 — -10 -15 -55 9 -8 -1l 
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假设 是 

Ho: 双 胞 胎 中 第 一 个 出 生 的 并 不 比 第 二 个 更 具有 进取 心 (E(X;) 夺 E07;)) 

Hi: 双 胞 胎 中 第 一 个 出 生 的 比 第 二 个 出 生 的 更 具有 进取 心 (E(X) > E(Y;)) 
这 些 对 应 于 假设 B， 我 们 假设 测试 分 数 是 个 人 进取 心 的 精确 度量 .由 于 有 很 多 结 ， 
检验 统计 量 是 


> Ri —17 
T = —— = — = -0.7565 9 
V 之 Rz V505 @ 


水 平 a =0. 05 的 判别 区 域 对 应 于 着 了 值 小 于 -1.6449 (由 表 Al 获得 ) ， 因 此 ， 接 受 
H, H (7) 式 ，p- 值 是 0. 238. 
如 果 用 T 和 表 A12， 我 们 会 得 到 7* =24.5， 临 界 域 对 应 着 T' 的 值 小 于 14.， 所 
以 得 到 同样 的 结论 ， 类 似 的 p- 值 由 对 表 A12 中 的 ws 和 wo 插值 得 到 . m 
Wilcoxon 符号 秩 检验 等 同 于 中 位 数 检 验 ， 其 中 数据 由 容量 为 n B) 8. 4° BE JLE 2 
Y,,…, 站 ,组 成 ， 令 Y 是 与 Y, 同 分 布 的 随机 变量 ，m 是 指定 的 常数 . 对 应 于 前 面 假设 
集 A，B 和 C 的 假设 如 下 . 


(a) (双边 检验 ) 
Ho: Y PARET m 
Hi: Yf rR iy 3k RS m 
(b) (左边 检验 ) 
Ho: Y RIPA > m 
Hi: Y RPA < m 
(c) (右边 检验 ) 


Ho: Y WPA < m 
Hi:Y 的 中 位 数 > m 
由 于 YY 的 分 布 对 称 性 假设 ,“ 均 值 ” 可 以 代替 这 些 假 设 的 “中 位 数 ” 
这 就 形成 了 数 对 (my,Y ) ,(m,Y ),…,(m,Y,) ， 完 全 按照 Wilcoxon 符号 秩 检 
验 描述 的 来 处 理 这 些 数 对 ， 而 Wilcoxon 检验 方法 中 其 余部 分 保持 不 变 . 下面 的 例子 
来 解释 这 个 方法 . 
例 5.7. 2 
为 了 检验 假设 Y 的 均值 ，E( Y) 不 会 大 于 30 (假设 C)， 得 到 随机 变量 Y 的 30 个 
观测 . 
Ho: E(Y) < 30 
Hı: E(Y) > 30 
观测 值 ， 差 Y - m， 以 及 数 对 的 秩 列表 如 下 (为 了 方便 ， 随 机 样本 先 排序 ). 
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Yi D, = Y; — 30 |D;| $4 Y; D = Y = 30 Dj| 的 秩 
23.8 一 6.2 17 35.9 十 5.9 15 
26.0 一 4.0 11 36.1 十 6.1 16 
26.9 一 3.1 8 36.4 十 6.4 18 
27.4 一 2.6 6 36.6 十 6.6 19 
28.0 一 2.0 5 37.2 +7.2 20 
30.3 +0.3 1 37.3 十 7.3 21 

30.7 十 0.7 2 37.9 十 7.9 22 
31.2 十 1.2 3 38.2 十 8.2 23 
31.3 十 1.3 4 39.6 十 9.6 24 
32.8 十 2.8 Z 40.6 +10.6 25 
33.2 +3.2 9 41.1 +11.1 26 
33.9 +3.9 10 42.3 +12.3 27 
34.3 +4.3 12 42.8 +12.8 28 
34.9 +4.9 13 44.0 十 14.0 29 
35.0 十 5.0 14 45.8 十 15.8 30 


从 表 A12 中 可 得 0.05 分 位 数 是 152， 所 以 0.95 分 位 数 是 465 -152 =313. 因此 ， 尺 
RE <0. 05 的 临界 域 对 应 着 检验 统计 量 大 于 313. 
用 (3) 式 定义 检验 统计 量 ， 在 这 种 情况 下 ， 7’ 等 于 D. 为 正 的 那些 秩 的 和 . 
T+ = 418 (10) 
由 于 7T’ 值 较 大 ， 所 以 拒绝 H,， 我 们 得 出 结论 是 , Y 的 均值 大 于 30. 
H (8) 式 ， 近 似 的 p- 值 为 ; 


EER-1 ) ( aL) 
P | Z > —— 5] = P| Z2 = P(Z = 3.8051 
( V n(n + 1)(2n + 1)/6 v 9455 ( ) 
由 表 Al 显示 p- 值 小 于 0. 0001. m 


口 理论 ”这 个 模型 说 明 所 有 的 差 D, 有 一 个 共同 的 中 位 数 daoo, "í H, WAR, dost 
于 0， 由 对 称 性 的 定义 ， 每 个 D, 为 负 的 概率 等 于 它 为 正 的 概率 ， 对 于 连续 分 布 ， 或 
者 对 于 D, 为 没有 零 值 的 离散 分 布 ， 这 个 概率 等 于 0. 5.( 若 没有 对 称 性 ， 正 的 差 就 有 
可 能 倾向 于 比 负 的 差 大 或 者 小 ). 

考虑 这 些 的 目的 就 是 寻找 H, 为 真 时 检验 统计 量 T 的 分 布 ， 首 先 ， 我 们 将 考虑 
双边 检验 的 零 假 设 ， 所 得 到 的 分 布 也 可 以 相当 好 地 应 用 到 单 边 检验 中 . 

考虑 nn 个 从 1 到 nn 编号 的 筹码 ， 如 果 数 据 没 有 结 ， 其 对 应 于 数据 的 个 秩 ， 假 设 
每 个 筹码 的 编号 都 写 到 它 的 一 面 (正面 ) ， 而 它 的 编号 的 负数 写 到 另 一 面 (反面 ) 
( 像 6 和 -6)， 投 掷 每 个 筹码 使 得 它 落 地 时 等 可 能 地 显示 任意 一 面 ， 并 与 (X, Y,) 
的 秩 对 应 ， 它 们 等 可 能 地 对 应 于 一 个 正 的 D, (符号 秩 R, 等 于 秩 ) 或 一 个 负 的 D. 
(HERR 等 于 其 负 秩 )， 令 T* 是 投掷 所 有 ) 个 筹码 之 后 显示 正 的 编号 的 和 ， 这 正好 
对 应 于 (3) 式 中 7* 的 定义 ， 在 筹码 游戏 中 7* 的 概率 分 布 与 当 H, 为 真 时 由 (3) R 

定义 7" 的 概率 分 布 一 样 ， 但 是 对 筹码 游戏 ， 它 更 容易 想像 
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筹码 游戏 的 样本 空间 由 诸如 (1,2,3, -4, -5,6,7,…,n) 这 样 的 点 组 成 ， 像 例 
5.7.1 中 的 数据 集 一 样 ， 仅 仅 是 尺 , 的 重 排 . 由 于 投掷 之 间 是 相互 独立 的 ， 所 以 2 个 
点 中 每 一 个 出 现 的 概率 都 是 (1/2)". 检验 统计 量 7 为 样本 点 中 正 数 的 和 .， 因 此 T* 
等 于 任意 数 x 的 概率 就 是 将 正 数 和 为 xx 的 那些 样本 点 的 个 数 ， 乘 以 概率 (1⁄2)" 
得 到 . 

例如 ， 如 果 n=8， 那 么 T' 等 于 0， 只 有 一 种 方式 ( 即 所 有 的 正 编号 的 面 都 朝 
下 )， 所 以 P(T=0) = (1/2)".T* =1 只 有 一 种 方式 ，T* =2 只 有 一 种 方式 , (HJ T° 
=3 有 2 种 方式 , 点 ( -1,-2,3, -4, -5,-6,-7,-8) 和 (1,2, -3, -4, -5, 
-6, -7, -8).T* =4 也 有 2 种 方式 ， 即 

P(T+=0)=(l1/2)8=1/256 P(T* <0) = 0.0039 


P(T* = 1) = 1/256 P(T: <1) = 0.0078 

P(T* = 2) = 1/256 P(T* <2) = 0.0117 

P(T* = 3) = 2/256 P(T* <3) = 0.0195 

P(T+ = 4) = 2/256 P(T* <4) = 0.0273 
等 等 


当 n<20 时 ，Owen(1962) 把 Ti’ 的 分 布 函 数列 成 表格 ， 当 nn<50 Ht, TRIA RR 
Harter 和 Owen( 1970) 中 的 表格 ， 对 7 大 100 ,McCornack( 1965) 给 出 了 有 选择 的 分 位 
数 表 ， 那 个 表格 比 我 们 这 里 需要 的 更 广泛 ， 所 以 本 书 中 的 表 Al2 给 出 了 更 有 用 的 选 
择 分 位 数 表 ， 用 表 Al12 时 ， 一般 会 导致 一 个 稍微 保守 的 检验 ， 因 为 小 于 p- 分 位 数 的 
概率 可 能 会 小 于 p， 例 如 在 前 一 段 中 ,n=8， 表 Al2 给 出 了 三 的 0.025 分 位 数 是 4， 
而 对 应 于 T` 小 于 4 的 临界 域 的 真正 水 平 是 0.0195. Claypool(1970) 以 及 Chow 和 
Hodges(1975 ) 给 出 了 关于 TT! 精确 分 布 的 进一步 结果 . 

对 于 单 边 检 验 ， 当 中 位 数 之 差 是 0 时 ， 样 本 点 属于 临界 域 的 概率 达到 最 大 值 ， 所 
以 这 是 要 考虑 的 情况 ， 因 此 在 H, 为 真 的 单 边 检验 中 ,前面 7 的 分 布 是 相当 有 效 的 . 

为 了 求 当 数据 有 结 时 T 的 条 件 分 布 ， 只 是 改变 上 述 讨 论 中 最 初 的 一 步 ， 即 筹码 
上 的 编号 必须 与 赋 给 所 考虑 数据 集中 数 对 (XY) 的 秩 和 平均 秩 一 致 、 记 这 些 秩 与 
平均 秩 为 a ,a,,…,a,， 在 例 5.7.1 P, RIA, a =1.5,a, =1.5,a =3， 等 等 ， 对 
这 些 数 ， 我 们 可 以 找到 T 的 分 布 ， 因为 在 例 5.7.1 中 有 11 个 数 ， 在 样本 空间 中 有 
2" =2048 个 点 ， 这些 点 中 最 小 的 5% ， 大 约 是 102 个 点 ， 它 们 构成 临界 域 ， 对 于 手工 
制 表 ， 这 些 点 的 个 数 太 多 了 ， 所 以 用 正 态 遥 近 . 

为 了 用 正 态 通 近 ， 令 S 为 所 有 R 的 和 .然后 用 1.5 节 中 的 中 心 极 限定 理 ， 我 们 
需要 当 H, 为 真 时 ,5 的 均值 和 方差 . 注意, EH, F 

P(R; = ai) = 1/2 和 P(Ri = —ai) = 1/2 
所 以 
E(R;) = a (8) + (—ai) (#) = 0 (11) 

和 
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Var (R) = a? (B) + (~a) G) = a? (12) 
因为 |R| 相互 独立 〈 筹 码 是 独立 投掷 的 ) ， 我 们 可 以 应 用 定理 1.4.1 和 1.4.3， 得 到 
E(S)=y E(R) = 0 (13) 
i=l 
及 
Var (S) = S Var (Ri) = > Qi (14) 
i=1 i=] 
但 是 ， 由 于 ai 总 是 等 于 R (符号 总 是 + ) ， 我 们 说 
Var (S) = 5 RÊ (15) 
jai 
并 将 中 心 极 限定 理应 用 于 
s Ri 
T= (16) 


i=] 
只 要 精确 表 不 可 用 时 ， 就 用 连续 性 修正 时 的 正 态 分 布 作为 近似 ，Veorlickova( 1970) 和 
Conover( 1973a ) 给 出 了 处 理 结 的 验证 . 口 
这 里 提出 的 处 理 零 差 的 方法 是 Wilcoxon( 1949 ) 所 建议 的 . Pratt(1959 ) 完整 地 讨 
论 了 另 一 个 处 理 零 差 的 方法 ， 它 包括 将 零 差 保 留 下 来 ， 如 所 描述 的 对 |D, | 排序 ， 并 
将 所 有 的 D, =0 当 作 一 个 结 来 处 理 ， 用 通常 的 方法 给 它们 赋 以 平均 秩 ， 除 了 当 D, =0 
Bf, R. =0 外 ，R, 和 通常 一 样 定义 ,然后 由 (5) 式 来 计算 T， 并 与 表 Al 比较 . 当 检 
验 假设 时 ， 不 在 Pratt 的 方法 中 使 用 表 A12, 但 是 ，Rahe (1974) 给 出 了 一 些 精确 表 . 
Conover(1973b) 给 出 的 比较 表明 ， 每 个 处 理 零 点 的 结 的 方法 都 会 在 某 些 情况 下 比 其 
他 方法 更 有 效 ， 所 以 ， 相 比 之 下 没有 理由 更 喜欢 某 一 个 .Pratt 保留 零 差 的 建议 将 用 
在 下 面 的 来 寻找 D, 的 共同 的 中 位 数 d, 置信 区 间 的 方法 中 ， 参见 Tukey ( 1949 ) 和 
Walker 和 Lev(1953 ) . 


> 中 位 数 差 的 置信 区 间 


数据 ”数据 由 n MZEE (X,Y), (X, Ya), (Xn, Yn) 各 自 的 观测 值 
(X,Y), (XY) "(x y.) 组 成 ， 对 每 一 数 对 ， 计 算 差 
D; = Yi — X, 
对 每 个 对 ， 将 它们 从 最 小 〈 最 负 的 ) 到 最 大 的 (最 正 的 ) 排列 ， 记 为 如 下 . 
DODËS.. . SD" 过 DO 

或 者 在 一 样本 情形 中 ， 数 据 由 单 样本 D, ,D,,- D, 组 成 ， 如 所 示 的 次 序 排 列 . 
我 们 希望 找到 D, 共同 的 中 位 数 (或 均值 ) 的 置信 和 区间. 
假定 条 件 

1. 每 个 D, 的 分 布 是 对 称 的 . 
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2. D, 相互 独立 . 

3. D, 都 有 相同 的 中 位 数 . 

4. D, 的 度量 尺度 至 少 是 区 间 的 . 
方法 ”为 得 到 1 -a 置信 区 间 ， 从 表 A12 中 获得 a/2 分 位 数 w... (MR wa =0， 则 对 
这 个 a 值 ， 得 不 到 置信 区 间 . ) 然后 对 所 有 的 i 和 j， 考 虑 n(n+1)/2 个 可 能 的 平均 
(D, +D,)/2, 包括 i=j, 它 是 D, 和 它 自己 的 平均 ， 即 D,， 这 些 平均 中 , 第 ws 大 的 
与 第 w “小 的 构成 1 -a 置信 区 间 的 上 下 界 ， 不 必 计 算 n(n+1)/2 个 平均 ;只 须 计算 最 
大 的 和 最 小 的 附近 的 平均 来 得 到 置信 区 间 ， 
计算 机 辅助 ”Minitab 和 StatXact 可 给 出 均值 差 或 中 位 数 差 的 置信 区 间 ， 以 及 著名 的 
Hodges-Lehmann 位 置 估计 . . 
例 5.7.1 ( 续 ) 
D, 的 12 个 值 按 顺序 排列 为 

—15, —12, —7, —5, 一 和 一 1 —1, 0, 2, 5, 6, 9 

要 找 出 中 位 数 差 的 95% 置 信 区 间 ， 用 n=12， 在 表 Al2 中 得 到 wows = 14. 这 14 个 
最 小 的 平均 , 由 ( -15 -15)/2 开始 ， 是 

—15, —13.5, —12, —11, 一 10, —9.5, —9.5, ~8.5, —8, —8, —8, —7.5, —7, —6.5 
所 以 ， 置 信 区 间 的 下 界 是 - 6.5. 14 个 最 大 的 平均 数 是 

9, 7.5, 7, 6, 5.5, 5.5, 5, 4.5, 4, 4, 4, 3.5, 3, 2.5 

所 以 ,置信 区 间 的 上 界 是 2.5， 进 取 性 得 分 的 中 位 数 差 (第 一 个 出 生 的 双胞胎 进取 
性 得 分 的 中 位 数 减 去 第 二 个 双胞胎 进取 性 得 分 的 中 位 数 ) 的 95% 置 信 区 间 是 


P(—6.5 < doso < 2.5) > 0.95 (17) 
R 14 EO 8 KERJA — ATEKUE, KRAFA E = fh EBE, H 
中 和 矩阵 的 行 和 列 是 所 有 的 D. 
-15 一 12 一 7 一 5 -4 一 | 一 ] 0 2 5 6 9 
一 15 —15 一 13.5 -11 一 10 -9.5 -8 -8 一 7.5 -6.5 -5 -45 -3 
-12 -12 -9.5 -8.5 -8 -6.5 -65 一 6 -5 一 3.5. =3 一 1.5 
一 7 一 7 一 6 ~5.5 一 4 -4 一 3.5 -25 -1 -0.5 1 
-5 一 8 -4.5 -3 -3 一 2.5 一 1.5 0 0.5 2 
—4 -4 -2.5 -25 一 2 一 0.5 1 2.5 
=] 一 1 -1 —0.05 0.5 2 2.5 4 
-1 —1 一 0.05 0.5 ë 2.5 4 
0 0 1 2.5 3 4.5 
2 2 3.5 4 5.5 
5 5 5.5 7 
6 6 7.5 
9 
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口 理论 ”为 了 看 差 平均 (D. +D,) /2 和 差 的 秩 之 间 的 关系 ， 考 虑 如 下 ， 假 设 没有 结 ， 
任何 D, 的 秩 ， 如 前 面 的 例子 中 ，D, =6 等 于 与 D, =6 相 比 离 0 一样 近 或 更 近 的 D, 的 
个 数 ， 通 过 计数 包含 D. 的 差 平均 在 0 到 6 之 间 的 数目 ， 我 们 可 得 到 D, 的 秩 (必须 小 
心 在 这 个 计数 中 ， 包 括 D, 本 身 的 平均 )， 对 所 有 正 的 D 重复 这 个 步骤 ， 作 为 总 计 
数 ， 我 们 得 到 检验 统计 量 T. 

D, 的 中 位 数 d, ;的 置信 区 间 可 以 用 Wilcoxon 检验 ， 对 各 种 不 同 的 m 值 检验 

Ho: dys0 = m 

来 求 得 .这 个 方法 等 价 于 从 每 个 D, 中 减 去 m 的 值 ， 并 检验 看 这 个 新 D, 的 中 位 数 是 否 
等 于 零 . 但 是 我 们 可 不 用 从 每 个 D, PRE m 的 值 ， 然 后 重新 排序 并 重新 计算 了 7” ， 容 
易 看 到 原来 D, 的 两 两 平均 ， 数 有 多 少 个 平均 在 m 〈 像 我 们 前 面 做 的 ， 它 代替 零 ,) 之 
上 上 ,并且 其 值 等 于 7T'. 再 逆 回 去 ， 从 7T' 的 临界 值 开始 ， 找 那些 最 大 的 平均 ， 停 止 点 是 
m 的 值 ， 它 不 能 导致 接受 H,， 这 样 ， 置 信 区 域 的 界 就 找到 了 . 口 

Noether( 1967b) 证 明了 如 果 连 续 性 假设 不 成 立 ， 带 有 端点 的 置信 区 间 (U A L) 
的 置信 系数 至 少 是 1 -a， 而 没有 端点 的 置信 区 间 (UML) 的 置信 系数 至 多 是 1 - 
aq， 因 此， 我 们 推荐 包含 端点 的 置信 区 间 及 下 列 形式 的 表述 : 

P(L < doso < U) >1 - e 

Moses( 1965 ) 给 出 了 这 个 寻找 置信 区 间 方 法 的 一 个 讨论 ， 如 果 抽 样 是 分 层 的 而 不 是 随 
机 的 ， 则 参见 McCarthy( 1965) 的 文章 ， 对 于 样本 中 有 其 他 类 型 的 相关 性 ， 参 见 Hey- 
land( 1968). Puri 和 Sen(1968) 给 出 了 多 元 随机 变量 情形 下 的 置信 区 域 . Geertsema 
(1970) 以 及 Srivastava 和 Sen ( 1973) 的 文章 表明 ， 序 贯 抽样 方法 能 提供 一 些 优点 . 
Schuster 和 Navarte ( 1973 ) , Noether ( 1973 ) , Johns ( 1974 ) 以 及 Maritz, Wu 和 Staudte 
(1977) 讨 论 了 其 他 估计 分 布 中 心 的 方法 ， 稳 健 位 置 估 计量 的 理论 上 的 讨论 参见 Seran 
(1977). 
与 其 他 方法 比较 

当 磁 到 配对 观测 ， 并 希望 检验 均值 差 是 否 为 零 ， 且 度量 尺度 如 本 节 所 述 的 是 区 
间 尺 度 时 ， 第 一 个 想起 的 检验 通常 是 “配对 上 检验 ”， 也 称 作 “一 样本 上 检验 ”， 这 个 
检验 用 检验 统计 量 


D 


= 
Jl 5p -p? 
n(n — 1) 之 (Di - D) 


其 中 , D JE D, 的 样本 均值 ， 将 这 个 上 值 与 表 Al2 中 第 k=n -1 行 中 的 :分布 的 分 位 数 
比较 ， 为 了 让 表 A12 中 的 分 位 数 更 精确 ， 必 须 作 另外 的 正 态 性 假设 ， 即 对 Wilcoxon 
检验 加 上 假设 : D, 是 独立 同 分 布 的 正 态 随机 变量 . 

Wilcoxon 检验 的 假设 比 正 态 性 的 假设 更 容易 验证 ， 如 果 数 据 是 离散 型 的 ， 我 们 
立刻 知道 分 布 不 是 正 态 的 ， 因 为 正 态 分 布 是 连续 的 ， 如 果 偶 尔 有 很 大 或 很 小 的 观测 
值 ， 称 作 “ 离 群 值 " MJ :检验 的 功效 大 大 下 降 ， 不 应 该 用 它 . 


(18) 
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如 果 有 上 检验 的 计算 机 程序 ， 则 它 也 可 以 用 于 Wilcoxon 检验 ， 计算 1 值 时 ， 
LARRE D, 3F38 6353038 A21 比较 (如 刚才 描述 的 )， 这 个 近似 比 前 面 描 
述 的 正 态 副 近 稍 微 精 确 些 ， 而 且 对 有 结 的 情况 也 有 很 好 的 表现 . 细节 可 参见 
Iman (1974a ) . 

Wilcoxon 符号 秩 检验 相对 于 配对 上 检验 的 渐 近 相对 效率 (A. R.E.) 可 在 下 面 的 
约束 下 进行 计算 . 

1. 二 维 随 机 变量 (X,Y ) ,(X,,Y,),…, (X,Y,) 构 成 随机 样本 . 

2. 除了 均值 上 的 差异 外 , X, 与 Y, 同 分 布 . 

在 这 些 条 件 下 ，A. R. E. 的 范围 可 能 从 108/125 = 0. 864 直到 无 穷 ， 但 是 ， 惊 奇 
的 是 它 能 保证 从 不 会 小 于 0.864， 因 此 Wilcoxon 检验 不 会 太 差 ， 但 是 在 某 些 条 件 下 ， 
它 与 通常 的 参数 检验 相 比 可 以 相当 地 好 . 

更 进一步 地 说 ， 如 果 差 D, 有 正 态 分 布 ， 则 A R E 是 3/x =0.955， 如 果 我 们 假设 
差 D, 的 分 布 换 为 均匀 分 布 ， 则 A. R.E. 是 1.0， 对 双 指 数 分 布 来 说 ， 则 A. R E. 是 1.5. 

在 前 面 的 约束 下 ， 符 号 检验 (3.4 节 ) 可 以 用 于 检验 和 Wilcoxon 检验 相同 的 假 


设 . 那么 这 时 ， 符 号 检验 关于 Wilcoxon 检验 有 如 下 的 A. R. E. : 
假设 的 分 布 A.R.E. 
Et% š 
均匀 $ 
双 指 数 和 


令 人 惊讶 的 是 ， 在 有 些 情况 下 ， 符 号 检验 比 Wilcoxon 检验 更 有 效 ， 与 配对 上 检 
验 相 比 ，Wilcoxon 的 A. R. E. 对 于 双 指 数 分 布 是 3/2， 因 此 ， 两 个 A. R. E. 相 乘 就 给 
出 符号 检验 关于 配对 + 检验 的 A.R. E. ， 它 为 

(8) (2) = 2 
对 双 指 数 分 布 ， 符 号 检验 的 渐 近 效率 是 配对 上 检验 的 2 倍 ， 然 而 在 这 个 情形 下 ， 
A.R.E. 不 是 小 样本 效率 好 的 指标 ， 见 Conover, et al. (1978) 对 两 样本 情形 的 讨 
$. 对 于 来 自 双 指 数 分 布 的 小 样本 Wilcoxon 符号 秩 检验 的 效率 比 符 号 检验 和 上 检验 
都 好 ， 对 于 其 他 的 功效 和 效率 的 研究 ， 见 Klotz (1963 ,1965 ) , Arnold ( 1965 ) , Noether 
(1967a)# Kraft 和 van Eeden( 1972). 

Wilcoxon 符号 秩 检验 有 时 也 叫做 对 称 性 检验 ，Schuster( 1975 ) 以 及 Rao,Schuster 
和 Littell( 1975) 讨论 了 对 称 分 布 的 估计 ， 同 时 Rothman 和 Woodroofe ( 1972 ) H H T3 
外 的 对 称 性 检验 . Bell 和 Haller( 1969) ,Hollander( 1971 ) 以 及 Bhattacharyya ,Johnson 和 
Neave( 1971) 讨论 了 二 维 随 机 变量 的 对 称 性 检验 ， Bennett ( 1965 ) 以 及 Sen 和 Puri 
(1967 ) 研 究 了 推广 到 多 元 随机 变量 的 情形 。Hollander(1970) 将 Wilcoxon 检验 用 于 检 
验 两 条 回归 线 的 平行 。 Miller ( 1970) , Weed , Bradley 和 Govindarajulu ( 1974 ) , Sen 和 
Ghosh(1974) ,Reynolds( 1975 ) 以 及 Spurrier 和 Hewett( 1976 ) 所 出 了 适应 性 序 贯 抽样 方 
法 ， 其 他 和 本 节 相 关 的 文章 见 Groeneveld (1972 ) 以 及 Bickel 和 Lehmann ( 1975). 
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Walsh( 1949) 提出 的 检验 和 于 <7 的 Wilcoxon 检验 相同 ,但 不 同 于 n 大 于 等 于 7 的 情 
JÉ. Schach(1969a) 给 出 了 由 Batschelet( 1965 ) 提出 的 Wilcoxon 检验 包括 圆 分 布 在 内 的 
应 用 . 


习题 


1. 选择 由 20 个 开机 动车 的 司机 组 成 一 个 随机 样本 ， 看 酒精 是 否 影响 反应 时 间 . 在 实验 室 中 
测量 了 每 个 司机 在 喝 一 定量 含有 酒精 的 饮料 前 后 的 反应 时 间 . 这 反应 时 间 如 下 


(以 秒 计 ). 
对 象 前 后 对 象 前 后 
1 .68 .73 11 .65 72 
2 .64 .62 12 .59 .60 
3 .68 .66 13 .78 .78 
4 .82 .92 14 .67 .66 
5 .58 68 15 .65 .68 
6 .80 .87 16 26 an 
7 yy .77 17 .61 .72 
8 .65 .70 18 .86 .86 
9 .84 .88 19 .74 vy: 
10 be .79 20 .88 .97 
酒精 影响 反应 时 间 吗 ? 
2. 一 名 食品 店主 希望 看 到 ， 是 否 可 以 认为 每 次 出 售 时 顾客 所 买 物品 数量 的 中 位 数 是 10， 所 
以 他 在 收 款 台 前 观察 了 12 名 顾客 . 
顾客 。 ”物品 数量 ME 。 ”物品 数量 
1 22 7 15 
2 9 8 26 
3 9 47 
4 5 10 8 
5 1 11 31 
6 16 12 7 


可 以 用 Wilcoxon 检验 吗 ? 在 这 个 问题 中 ， 违 反 了 模型 的 哪个 假设 ? 
检验 例 3. 5. 3 的 数据 ， 看 第 二 年 的 观测 值 是 否 倾向 于 比 第 一 年 的 观测 值 小 - 


3. 
4. 给 女子 篮球 队 的 每 名 成 员 一 个 简短 的 热身 ， 然 后 让 她 们 每 人 罚 25 个 球 ， 记 录 其 命中 的 个 


数 X、 然 后 给 这 个 队 以 大 运动 量 训练 ， 在 简短 的 休息 后 ， 让 她 们 每 人 再 罚 25 个 球 ， 再 记 
录 其 命中 的 个 数 Y， 这 些 数 据 表明 当 运 动员 累 了 时 罚球 命中 率 会 下 降 吗 ? 
运动 员 
1 2 3 4 5 6 7 8 9 10 1 12 


X (之 前 ) 18 12 7 21 19 14 8 11 19 16 8 1 
Y (之 后 ) 16 10 8 23 13 10 8 13 9 8 8 5 


5. 参与 竞选 的 候选 人 意识 到 ， 如 果 她 挑选 她 所 在 部 门 的 中 间 职位 ， 则 她 的 得 票 率 最 大 ， 因 


此 ， 她 设计 了 一 个 问卷 ,将 其 发 给 15 个 投票 者 (类 似 于 随机 样本 )， 问 卷 结果 得 分 从 一 
个 极端 值 (0) 打 到 另 一 个 极端 值 (10). 
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投票 者 ”分数 ”投票 者 ”分数 RRE JR 


1 6.7 6 9.3 11 8.8 
2 4.2 7 8.9 12 5.4 
3 4.1 8 7.4 13 6.1 
4 2.3 9 7.4 14 6.0 
5 6.1 10 9.3 15 4.9 


求 这 个 得 分 中 位 数 的 90% 置信 区 间 . 基于 本 节 的 方法 ， 你 的 得 分 中 位 数 的 点 估计 是 什么 ? 

6. 急救 班 负责 一 个 又 长 又 窗 的 湖上 的 安全 ， 他 们 和 希望 在 现场 建 一 个 永久 站 点 ， 可 以 最 小 化 
将 来 他 们 到 达 事 故 现场 的 总 距离 ， 那 个 地 方 应 该 在 事故 发 生地 点 的 中 间 位 置 ， 假设 已 发 
生 的 事故 类 似 于 所 有 今后 可 能 发 生 的 事故 的 随机 样本 ， 测 量 ( 到 水 坝 ) 的 距离 如 下 . 


距离 距离 
事故 (3E) 事故 ( 英里 ) 
1 7.1 8 6.1 
2 4.4 9 22 
3 3.9 10 6.7 
4 ee 11 4.9 
5 4.2 12 7.3 
6 3.4 13 0.3 
7 1.1 14 7.6 


水 坝 到 站 点 的 最 佳 距离 的 95% 置信 区 间 是 什么 ? 
7. 随机 选 到 7 对 已 婚 夫妇 ， 问 每 位 丈夫 及 妻子 今年 会 花 多 少 钱 来 给 配偶 买 圣 诞 礼物 .回答 
如 下 . 
夫妇 
1 2 3 4 5 6 7 


丈夫 25 21 38 64 52 16 26 
++ 16 42 56 4 19 26 24 


(a) 求 出 丈夫 所 花 钱 数 超过 妻子 所 花 钱 数 的 中 位 数 的 95% 置信 区 间 . 
(b) 你 求 得 的 区 间 的 精确 置信 水 平 是 多 少 ? 
8. 4 名 报考 研究 生 的 学 生 参 加 了 两 次 GMAT， 成 绩 如 下 . 
学 生 第 一 次 考试 第 二 次 考试 


1 470 510 

2 530 550 

3 610 600 

4 440 490 
(a) 求 出 Wilcoxon 符号 秩 检验 统计 量 的 精确 分 布 ， 即 正 符号 秩 的 和 ， 并 且 画 出 它 的 分 布 


函数 图 , 

(b) fE (a) 部 分 所 作 的 图 中 ， 标 出 检验 统计 量 值 的 位 置 ， 无 论 哪个 更 小 ， 求 出 右边 检验 
的 精确 p- 值 ， 或 者 是 左边 检验 的 p- 值 . 

(c) 对 于 平均 得 分 增 量 ， 求 出 它 非 参数 的 80% (近似 地 ) 置信 区 间 ， 

(d) 所 求 得 的 区 间 的 精确 置信 水 平 是 多 少 ? 


思考 题 | 
l. 当 n=5 时 , 求 本 节 中 检验 统计 量 T 的 概率 分 布 (假设 双边 检验 中 H, WA). 
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2. 在 Wilcoxon 符号 秩 检验 中 ， 不 考虑 零 差 以 便 使 用 精确 表 .， 为 什么 当 我 们 寻找 中 位 数 差 的 
置信 区 间 时 最 好 考虑 等 差 呢 ? 

3. 如 果 我 们 用 符号 秩 R, 来 计算 上 统计 量 ( (18) R) 而 不 是 使 用 差 Di 证明 这 个 统计 量 就 
是 如 下 了 的 函数 . 


正如 (5.12.3) 式 所 示 . 并 且 证 明 : 当 T 上 升 时 ,tr 也 上 升 ， 因 此 当 了 足够 大 时 拒绝 H, 
等 价 于 ts 足够 大 时 拒绝 Ho. 


4， 用 习题 4 中 的 数据 来 计算 配对 + 检验 统计 量 ， 并 与 Wilcoxon 检验 相 比 较 . (AR A21, 其 


中 行 k=11; 在 配对 :检验 中 要 考虑 零 . ) 


5.8 多 个 相关 的 样本 


在 5. 2 节 中 ， 我 们 介绍 了 关于 多 个 独立 样本 的 Kruskal-Wallis 秩 检验 ， 这 也 是 对 
于 5. 1 节 中 所 介绍 的 两 个 独立 样本 Mann-Whitney 检验 的 拓 广 . 在 这 一 节 ， 我 们 将 考 
虑 分 析 多 个 相关 样本 的 问题 ， 这 也 是 我 们 在 前 一 节 中 所 考虑 的 配对 或 两 个 相关 样本 
问题 的 拓 广 首先， 我 们 将 提出 Friedman 检验 ， 它 是 3.4 和 3.5 节 中 所 讲述 符号 检 
验 的 拓 广 ， 然 后 我 们 将 介绍 Quade 检验 ， 即 前 一 节 中 介绍 的 Wilcoxon 符号 秩 检验 的 
拓 广 .在 这 两 个 检验 中 ，Friedman 检验 更 有 名 ， 且 需要 的 假定 比较 少 ， 但 是 当 只 有 3 
个 处 理 时 ， 它 缺乏 功效 ， 就 像 只 有 2 个 处 理 时 ， 符 号 检验 的 功效 不 如 Wilcoxon 符号 
秩 检验 一 样 ， 当 有 4 个 或 5 个 处 理 时 ，Friedman 检验 的 功效 和 Quade 检验 的 几乎 一 
样 . 但 是 当 处 理 的 个 数 是 6 个 或 6 个 以 上 时 ，Friedman 检验 会 有 更 高 的 功效 .功效 和 
A. R. E. 的 比较 可 参见 Iman et al. ( 1984) 以 及 Hora 和 Iman( 1988). | 

设计 一 个 用 来 检测 k(k 宇 2) 个 可 能 不 同 处 理 中 的 差异 的 试验 ， 可 以 引出 多 个 相关 
样本 的 问题 ， 在 区 组 内 排列 观测 ， 这 些 区 组 是 个 在 某 些 重 要 方面 相似 的 试验 单位 的 
组 ， 如 大 个 同 窝 出 生 的 仔 畜 ， 那 么 这 些 仔 畜 对 某 种 特殊 刺激 的 反应 较 之 在 任意 的 窝 里 
随机 选取 仔 畜 的 反应 更 加 相似 .对 这 一 个 组 内 的 大 个 试验 单元 随机 配 以 上 种 仔细 的 处 
理 ， 所 以 每 种 处 理 在 每 个 组 内 只 执行 一 次 ， 以 这 种 方式 ， 对 处 理 之 间 进 行 相互 比较 ， 
且 没 有 过 多 的 混淆 试验 结果 的 影响 ， 记 4。 为 所 用 区 组 的 总 数 ，b >1. 

这 里 描述 的 试验 排列 通常 叫做 随机 化 的 完全 区 组 设计 (randomized complete block 
design)， 这 个 设计 可 以 与 下 一 节 描 述 的 不 完全 (incomplete) 区 组 设计 进行 比较 ， 而 不 
完全 区 组 设计 不 包含 足够 的 试验 单元 ， 使 所 有 的 处 理应 用 到 所 有 区 组 ， 所 以 ， 每 个 处 理 
出 现在 一 些 区 组 中 ,但 不 会 出 现在 其 他 区 组 中 ， 随 机 化 的 完全 区 组 设计 的 例子 如 下 . 

1. 心理 学 (Psychology). 35 窜 老 鼠 ， 每 窜 中 有 4 只 老鼠 ， 用 于 考查 环境 与 侵 
犯 性 之 间 的 关系 我们 认为 每 一 窝 是 一 个 区 组 .设计 了 4 组 不 同 的 环境 ， 把 每 窝 中 
的 一 只 老鼠 放 在 一 个 环境 中 ， 使 得 从 每 窝 中 取出 的 4 只 老鼠 在 4 个 不 同 的 环境 中 .在 
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一 定 长 的 时 间 后 ， 对 老鼠 和 它们 的 同 窜 出 生 仔 畜 重 新 分 组 ， 且 根据 侵犯 度 进行 排序 . 

2. 家 庭 经 济 (Home economics). 比较 6 种 不 同类 型 的 生 面包 团 ， 每 一 类 型 的 生 
面包 团 形 成 3 块 ， 看 哪个 烤 得 最 快 . 用 3 种 不 同 的 烤箱 ， 且 每 个 烤箱 同时 烤 6 种 不 同 
类 型 的 面包 ， 烤 箱 是 区 组 ， 生 面包 团 是 处 理 

3. 环境 工程 (Environmental engineering). 如 果 不 同 的 处 理 可 以 应 用 到 同一 个 单 
元 而 没有 留 下 残余 影响 ， 则 一 个 试验 单元 可 以 形成 一 个 区 组 . 7 个 不 同 的 男士 参与 配 
色 方 案 对 工作 效率 影响 的 研究 ， 认 为 每 个 人 是 一 区 组 ， 且 在 3 个 房间 的 每 一 间 都 待 
一 段 时 间 ， 每 一 间 都 有 自身 类 型 的 色彩 设计 ， 在 房间 里 时 ， 每 个 人 只 执行 一 个 任务 ， 
并 度量 其 工作 效率 ，3 个 房间 则 是 处 理 . 

到 目前 为 止 ， 读 者 应 该 对 随机 化 的 完全 区 组 设计 的 种 类 有 了 一 些 概念 ， 检验 零 
假设 为 没有 处 理 区 别 的 通常 参数 方法 叫做 双 因素 方差 分 析 ， 下 面 的 非 参 数 方法 只 依 
赖 于 每 个 区 组 内 观测 的 秩 . 因此， 可 以 考 虚 用 秩 的 双 因 素 方 差分 析 . 这 个 检验 将 按 
它 的 发 明 者 ， 一 个 著名 的 经 济 学 家 Milton Friedman 来 命名 . 


> Friedman 检验 
数据 “数据 是 由 名 个 相互 独立 的 大 维 随机 变量 组 成 ， 记 为 (Xa Xas Xa), HP i= 
1,2,…,b， 称 为 b 个 区 组 ， 随 机 变量 X, 表 示 在 第 i 区 组 中 用 处 理 j 的 样本 . b 个 区 组 
排列 如 下 : 


处 理 
区 组 1 2 e. k 
1 Xu X12 Pusak; Xx 
2 Xz X> pi Xx 
3 Xa X> w. Xy 
b Xa Xi Xir 


记 R(X ) 为 秩 ， 它 从 1 到 大 ， 赋 给 区 组 (D i 中 的 X,， 即 对 于 区 组 i， 相 互 比 较 
随机 变量 六, ,XxX ,…,X,， 最 小 观测 值 赋 以 秩 1， 第 二 小 的 观测 值 赋 以 秩 2， 依 此 类 推 ， 
区 组 i 中 的 最 大 观测 值 赋 以 秩 给 所 有 b 个 区 组 进行 赋 秩 ， 如 果 有 结 ， 则 用 平均 秩 

我 们 对 每 一 处 理 的 秩 求 和 得 到 R， 其 中 ， 对 j=1,2,…,k 


b 
Rj = > R(X;) (1) 
i=1 


假定 条 件 
1. b 个 上 维 随机 变量 是 相互 独立 的 (一 个 区 组 的 结果 不 会 影响 其 他 区 组 的 结果 ). 


2. 每 个 区 组 内 的 观测 可 以 根据 某 些 感 兴趣 的 准则 进行 排序 . 
检验 统计 量 Friedman 建议 用 如 下 统计 量 : 


_ 12 < -Dy 2 
r “Kkr (a 2 (2) 


| 


370| 


270 第 5 章 秩 检 验 


如 果 有 结 现 象 存在 ， 那 么 我 们 需要 进行 相应 的 调整 ， 记 A, 为 秩 或 平均 秩 的 平方 
和 ， 则 有 


b k 
A1 = > > [R(X (3) 


“校正 因子 ”C, 由 下 式 计算 
C, = bk(k + 12⁄4 (4) 
因为 有 结 出 现 ， 经 校正 后 的 统计 量 T, 变 为 


k k 2 
-D| $R- tc: «-D5 (r D) 
- _ < 


g SEE Z; m 2 PSU C S 
t A -Cı A, — C; (9) 


最 近 的 研究 表明 ， 在 秩 R(X,) 上 计算 出 的 双 因 素 方 差分 析 的 统计 量 T,， 由 于 有 更 精 
确 的 有 逼近 分 布 ， 因 此 受到 人 们 的 喜欢 ， T, 可 简化 成 上 面 所 给 出 的 T, 的 函数 . 
b — 1)T 

= 
这 些 台 近 表达 的 细节 参见 Iman 和 Davenport( 1980). 
零 分 布 ”我 们 很 难 找到 统计 量 T，( 或 TT) 的 精确 分 布 ,， 因 此 我 们 往往 使 用 它们 的 到 
近 分 布 .T, 的 逼近 分 布 是 自由 度 为 k-1 的 x 分布， 但 是 ， 有 时 候 这 个 允 近 分 布 的 近 
似 程度 并 不 好 ， 因 此 我 们 推荐 用 T 而 不 用 T, ， 当 零 假 设 成 立时 ， 它 的 近似 分 位 数 由 
自由 度 为 有 =k-1,k, = (b--1)(k-1) 的 下 分 布 给 出 ( 见 表 A22). 
假设 


(6) 


Ho: 同 一 个 区 组 中 , 对 随机 变量 的 每 个 赋 秩 是 等 可 能 的 ( 即 处 理 效 
RAF. 

i: 至 少 有 一 个 处 理 倾向 于 比 其 他 处 理 中 的 至 少 一 个 处 理 产 生 较 
大 的 观测 值 . 


如 果 统 计量 T, 大 于 下 分 布 的 1 -a 分 位 数 ， 则 我 们 以 a 近似 水 平 拒绝 H,， 其 中 ， 
下 分 布 的 自由 度 为 上 =k-1l,k,=(b-1)(k-1). 这 个 近似 结果 相当 好 ， 并且 随 着 b 
的 增 大 近似 效果 越 好 .我们 可 以 根据 表 A22 估计 相应 的 近似 p- 值 . 
多 重 比较 ”只 有 当 Friedman 检验 导致 拒绝 零 假设 时 ， 我们 可 用 下 述 方 法 来 比较 各 个 
处 理 .， 如果 下 列 不 等 式 满 足 ， 则 认为 处 理 i 和 j 是 不 相同 的 . 
2(bA1 —>R?) J; 
|R; 一 R| > ti-a/2 | 
其 中 ，R,,R 和 4, 如 上 所 述 ，t,_。s 表 示 自 由 度 为 (b-1)(k-1) 的 1 分 布 的 上 侧 1 - 
a/2 分 位 数 ，a 值 与 上 面 Friedman 检验 所 用 的 值 相同 . 
另外 ，(7) 式 也 可 以 表示 为 关于 统计 量 T, WAX, 
(A, — C1)2b Tı $ 
IR; — Ri| > ti-a/2 = t = 7] (8) 
如 果 没 有 结存 在 ， 则 (7) 式 中 的 4, 可 以 化 简 为 : 


(7) 
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A; = bk(k + 1)(2k + 1)/6 
同时 ，(8) KPRI (A, - C,) 可 以 化 简 为 : 
A, — C = bk(k + 1)(k — 1)/12 

计算 机 辅助 ”在 Minitab ,Splus ,SAS 和 StatXact 中 都 有 Friedman 检验 的 计算 机 程序 . < 
例 5. 8.1 

随机 选 出 12 名 私房 业主 参与 一 个 种 植 苗 园 的 试验 .要 求 每 一 个 业主 从 他 的 院子 里 
选 出 合理 而 等 面积 的 4 块 地 种 植 4 种 不 同 的 草 ， 每 一 块 地 种 一 种 . 在 规定 的 时 间 段 
结束 后 ， 要 求 房 主 根据 加 权 一 些 重要 的 指标 如 支出 、 养 护 要 求 、 漂 亮 程度 、 耐 寒 
性 、 妻 子 的 喜好 等 等 ， 将 4 种 草 排序 ， 其 中 秩 1 赋 给 最 不 受 豆 爱 的 一 种 ， 秩 4 赋 给 
最 受 走 爱 的 一 种 ， 零 假设 为 : 4 种 草 的 受 喜 爱 程 度 没 有 区 别 ， 备 择 假设 为 : 有 某 种 
草 比 另 一 些 草 更 受 偏爱 ， 把 12 个 区 组 的 每 一 组 都 平均 分 成 了 等 面积 的 4 块 ， 受到 了 [371 
基本 相同 的 照料 ， 因 为 假设 了 这 4 块 都 由 同一 个 私房 业主 照料 .试验 的 结果 如 下 : 


草 
房 主 1 2 3 4 
1 4 3 z 1 
2 4 2 3 1 
3 3 1.5 1.5 4 
4 3 1 2 4 
5 4 2 1 3 
6 2 2 3 4 
7 1 3 2 4 
8 2 4 1 3 
9 35 1 2 3.5 
10 4 1 3 2 
11 4 a 3 1 
12 35 1 2 3.5 
R (总 和 ) 38 235 245 34 


首先 ，4, =356.5， 它 是 所 有 RA 的 平方 和 ， 即 总 平方 和 ，(4) 式 给 出 了 
c, = 202 -ao0 


(5) 式 给 出 了 

T,= 3[(38) + (23.5)? + (24.5 + (34) — 12(300)] 

356.5 — 300 
= 8.097 
ET A (6) 式 , 得 到 
_ _11(8.097) 
* 12(3) — 8.097 

近似 水 平 为 a =0. 05 的 临界 域 对 应 着 所 有 大 于 2. 90 的 T, 值 ， 根 据 表 A22， 我 们 得 
Ajk =3,k, =33 的 下 分 布 的 0.95 分 位 数 是 2.9， 即 如 果 T, >2.9， 则 拒绝 零 假设 
因此 我 们 拒绝 零 假 设 ， 并 可 以 得 出 结论 ， 某 种 草 比 另 一 些 草 更 受 偏 爱 ，P- 值 约 为 


= 3.19 
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0.04， 它 由 对 表 A22 中 的 值 做 内 插 得 到 . 这 意味 着 小 到 显著 水 平 a =0.04， 我 们 也 
能 拒绝 零 假 设 ， 对 于 多 重 比较 ， 根 据 表 A21 得 到 自由 度 为 (11) (3) =33 的 1 分 布 
的 分 位 数 mw 为 2.036. H (7) 式 ， 我 们 得 到 


2(bA1 — 2 RI)] 
t0.975 | = 11.49 


对 任意 的 2 种 草 ， 如 果 它 们 的 秩 和 大 于 11. 49 个 单位 ， 那 么 认为 它们 是 不 平等 的 . 
因此 认为 第 1 种 草 要 优 于 第 2 种 和 第 3 种 草 ， 其 他 的 区 别 则 不 显著 . m 

下 面 的 检验 方法 同样 也 是 检验 在 随机 化 的 完全 区 组 设计 中 ， 两 种 处 理 均 值 相 等 
的 零 假 设 ， 但 是 它 利 用 了 有 关 的 区 组 极 差 的 信息 ， 对 于 极 差 较 大 的 区 组 赋 耶 更 大 的 
权重 ， 所 应 用 区 组 内 赋 秩 的 方法 与 Friedman 检验 方法 相同 .我 们 将 根据 它 的 发 明 者 ， 
Dana Quade( 1972 ,1979 ) 来 命名 这 个 检验 . 


> Quade 检验 


数据 ” 先 按照 前 一 个 检验 所 描述 的 赋 秩 方法 给 区 组 内 的 R(X,) 赋 秩 ， 下 一 步 又 一 次 
用 到 了 原始 的 观测 X;,， 然 后 根据 每 一 区 组 极 差 的 大 小 ， 给 每 一 个 区 组 自身 赋 秩 ,其 
中 区 组 的 极 差 定 义 为 最 大 和 最 小 观测 值 的 差 值 . 

区 组 i 的 极 差 = iin {Xij} — ee {Xij} (9) 


每 一 个 区 组 计算 得 到 一 个 样本 极 差 ， 共有 b 个 样本 极 差 .， 其 中 极 差 最 小 的 区 组 赋 秩 
1， 第 二 小 的 区 组 赋 秩 2， 依 此 类 推 ， 极 差 最 大 的 区 组 赋 秩 为 bp。” 如 果 有 结存 在 ， 则 使 
用 平均 秩 . 记 1,2,…,b 区 组 各 组 的 秩 分 别 为 8, ,CQ 

最 后 ， 用 区 组 的 秩 Q, 乘 以 区 组 中 的 秩 R(X;) 与 区 组 内 的 平均 秩 (k+1)/2 的 差 
(E, ERR S, HP 


s =o [ræ -E ] a0) 


是 代表 区 组 内 每 一 个 观测 的 相对 大 小 的 统计 量 ， 调 整 使 之 反映 区 组 出 现 的 相对 显著 性 . 
记 S$, 为 第 /个 处 理 % 的 和 ， 
Se S (11) 
其 中 ， j= 1 2 ss K 
假定 条 件 “ 前 两 个 假设 与 前 面 检 验 中 提出 的 假设 相同 .由 于 我 们 在 检验 中 需要 对 区 
组 进行 比较 ， 所 以 需要 如 下 的 第 3 个 假设 . 
3. 每 一 个 区 组 可 以 确定 样本 极 差 ， 因 此 ， 可 以 给 区 组 赋 秩 . 
检验 统计 量 ”为 了 和 简便， 首先 计算 项 
b 
A= > 


l 


S; (12) 


k 
j=l 


5.8 多 个 相关 的 样本 273 


其 中 ，5; 由 (10) 式 给 出 ，A4, 称 为 “总 平方 和 ”".。 如 果 没 有 结存 在 ， 则 4, 可 以 化 简 为 


Az = b(b + 1)(2b + 1)k(k + 1)(k — 1)/72 (13) 
然后 计算 项 
k 
B= ; > s? (14) 
j=1 
Ht, Sh (11) 式 给 出 ，B 称 为 “处 理 平方 和 ”. 检验 统计 量 是 
_ (b — DB 
Ty = A= B (15) 


如 果 A =B， 则 认为 点 在 临界 域内 ， 并 可 以 求 得 p- 值 为 (1/k!1)”. 
注意 , T, 是 一 个 由 (10) 式 所 给 出 的 得 分 5S, 计算 出 的 双 因 素 方 差分 析 检 验 统计 量 . 
零 分 布 T, 的 精确 分 布 很 难得 到 ， 因 此 ， 如 同 前 面 Friedman 检验 中 的 那样 ， 可 用 自由 度 
分 别 为 k =k-1,k,=(b-1)(k-1) 的 下 分 布 来 通 近 ， 表 A22 给 出 了 FF 分 布 的 分 位 数 . 
假设 ”假设 与 Friedman 检验 的 假设 相同 . 
1 T, 超过 自由 度 为 k =k-1,k,=(b-1)(k-1) 的 下 分 布 的 1-a 分 位 数 (由 
表 A22 获得 ) ， 则 我 们 在 a 的 水 平 上 拒绝 零 假设 .事实 上 ,FF 分布 只 是 T, 精确 分 布 
的 一 个 近似 分 布 ， 而 精确 分 布 表 现在 我 们 还 无 法 求 得 . 随 着 5 值 的 增 大 ，F 近似 分 布 
将 接近 于 更 精确 . 
多 重 比较 只 有 当前 面 的 检验 结果 为 拒绝 零 假设 时 ,我们 才 可 做 多 重 比 较 . 如 果 以 
下 不 等 式 成 立 ， 
2b(A, — B) | 
(b — 1)(k — 1) 
我 们 则 认为 处 理 i 和 j 不 相同 ， 其 中 ，5;,5,,4,,B 如 前 面 说 述 ， -是 自由 度 为 (4 
-1)(k-1) 的 :分 布 的 1 -a2 分 位 数 ， 它 由 表 A21 获得 . 对 所 有 的 处 理 对 进行 这 
样 的 比较 ，a 与 Quade 检验 中 所 用 的 相同 . 
计算 机 辅助 ”StatXact 包含 有 Quade 检验 的 计算 机 程序 一 一 一 一 一 一 一 一 一 一 < 
例 5. 8. 2 
抽取 7 个 商店 进行 市 场 调查 ， 在 每 一 个 商店 中 ，5 种 不 同 品牌 的 新 型 洗手 液 依次 排 
开 . 在 一 周 结束 的 时 候 ， 计 算 每 种 品牌 的 销售 瓶 数 ， 结 果 列 表 如 下 : 


IS ~ Si| > -a2 | (16) 


顾客 人 数 (商店 内 部 的 秩 ) 
品牌 
商店 A B C D E 
1 5 (2) 4 (1) 7 (3) 10 (4) 12 (5) 
2 1 (2.5) 3 (5) 1 (2.5) 0 (1) 2 (4) 
3 16 (2) 12 (1) 22 (3.5) 22(3.5) 35 (5) 
4 5 (4.5) 4 (2.5) 3 (1) 5 (4.5) 4 (2.5) 
5 10 (3.5) 9 (2) 7 (1) 13 (5) 10 (3.5) 
6 19 (2) 18 (1) 28 (3) 37 (4) 58 (5) 
7 10 (5) 7 (2.5) 6 (1) 8 (4) 7 (2.5) 


374 
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每 一 个 商店 内 把 每 一 种 品牌 赋 秩 于 1 到 5， 如 果 存 在 结 ， 则 用 平均 秩 ， 括 号 中 的 值 
为 秩 R(X,). 
接着 ， 计 算 每 一 个 商店 内 的 样本 极 差 ， 即 最 大 观测 值 减 去 最 小 观测 值 ， 在 商店 1 


中 ， 样 本 的 极 差 是 12 -4 =8， 这些 样本 极 差 ， 样 本 极 差 的 秩 Q, 以 及 乘积 如 下 表 所 列 ， 


[376] 


Si; = Q[R(X;) — (k + 1)/2] 
Si; = Q [R(X;;) — 3] 


品 
W Hakuy Q a B W b’ ' 
1 8 5 -5 -10 0 +5 +10 
2 3 2 -1 +4 -1 -4 +2 
j 23 6 一 6 -12 +3 +3 +12 
4 2 1 +1.5 —0.5 -2 +1.5 -0.5 
S 6 u +2 一 人 一 8 十 8 十 2 
6 40 7 -7 -14 0 +7 +14 
7 4 3 Té. Zia 2259 2. 15 
S= -95 -38 -14 +23.5 +38 
H (12) RẸ, 
A; = Š $ S, = (-5} + (—10} + : - : = 1366.5 


i=1 j=1 


略 小 于 由 (13) 式 对 没有 结 情况 下 得 到 的 1400. H (14) 式 ， 得 到 
B -1% S? = L [(—9.5)? + (38)? + - + .] = 532.4 
"SLA 


再 带 和 人 (15) 式 , 就 得 到 检验 统计 量 


T. 66324) 383 


13665 5324 
T, 值 大 于 2.78， 它 是 由 表 A22 得 出 的 自由 度 =4,k, =24 的 下 分 布 的 0.95 分 位 数 ， 
因此 当 a = 0.05 时 ,拒绝 零 假设 .事实 上 ,仔细 查看 表 A22， 可 发 现 p- 值 咯 小 于 
0. 025， 因 此 我 们 可 以 得 出 结论 ， 某 些 品 牌 与 其 他 品牌 相 比 似乎 更 受 顾客 欢迎 . 
因为 拒绝 了 零 假设 ， 因 此 可 以 运用 多 重 比 较 . 由 (16) 式 ， 可 以 认为 两 个 处 理 
不 同 ， 如 果 它 们 的 15, - 5; | 大 于 
H-a/2 5238 = 2.064 paeo] = 45.53 
其 中 ,1 _, =tows， 它 是 由 表 A21 得 到 的 自由 度 为 (b -1)(k-1) =24 的 + 分 布 的 
0.975 分 位 数 . 因此 可 以 认为 品牌 A 和 E,B 和 D, B 和 E 以 及 C 和 E 彼 此 不 同 . 
注意 ， 下 图 显示 出 多 重 比较 的 结果 ， 其 中 ， 字 和 母 按照 平均 得 分 的 升序 排列 ， 下 


划 线 表示 处 理 没有 明显 的 区 别 . 
B C A D E B 
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口 理论 ”如 果 零 假设 成 立 ， 即 在 一 个 区 组 中 ,每 一 种 赋 秩 都 是 等 可 能 的 ， 则 我 们 可 
以 得 到 了 ,T, AT, 的 精确 分 布 ， 那 么 在 同一 个 区 组 中 ， 秩 R(X;) 可 能 的 排列 方式 有 
k!1 种 ， 因 此 在 全 部 b 个 区 组 排列 的 数组 中 有 (kl) 种 秩 的 排列 方式 ， 前 面 提出 的 
假设 ,表示 在 零 假设 成 立 的 前 提 下 ， X (41) 种 排列 方式 出 现 的 可 能 性 是 相同 的 . 
因此 ， 给 定 样本 数 上 和 区 组 bp， 我 们 可 以 通过 列 出 秩 的 所 有 可 能 排列 方式 ， 并 对 每 
一 种 排列 计算 T. ,了 ,7T;， 从 而 得 到 它们 的 概率 分 布 浮 数 . 

例如 ， 如 果 k=2,b=3, 则 有 (2!1) =8 种 等 可 能 秩 的 排列 方式 ,下 表 列 出 了 每 一 
种 排列 方式 相应 的 T ,7T, 值 ， 我 们 将 在 后 面 的 内 容 中 考虑 T. 


排列 
区 组 1 2 4 5 6 7 8 
1 L: L2 L2- 2r 21 21I 32 ZI 
2 L: GI. 21 L2 ZI Pe 21r 21 
3 12 Sit 2 L2. 12 AT 2t 21 
mE 1/8 1⁄8 1⁄8 1⁄8 1⁄8 18 1⁄8 1⁄8 
T; #y 48 oo ł i å i i i eo 
T, 的 值 3 ; 3 i i i 3 3 


因此 ， 当 H, 成 立时 ，7 的 概率 分 布 为 P(T =—) =3/4,P(T =3) =1⁄4,T, 的 概率 


分 布 为 已 (了 = 本) =3/4,P(T, =œ ) =1⁄4. 


为 了 检查 T, 在 零 假 设 下 的 行为 ， 如 前 所 述 ， 我 们 再 看 一 下 秩 R(X;) 的 8 种 可 能 
的 排列 情况 ， 用 每 一 个 秩 减 去 平均 秩 1.5， 此 时 我 们 考虑 区 组 的 秩 分 别 为 C, = 1 ,0Q, = 


2 Q; =3 的 情况 . S 的 计算 结果 如 下 ， 
排列 
区 组 1 2 3 4 
1 —0.5, +0.5 —0.5, +0.5 —0.5, 十 0.5 +0.5, 一 0.5 
2 —1, +1 —1, +1 +1, —1 —1, +1 
3 —1.5, +1.5 +1.5, —1.5 —1.5, 十 1.5 —1.5, 十 1.5 
条 件 概率 1/8 1/8 1/8 1/8 
T;3 的 值 12 0 机 15 
排列 
区 组 5 6 8 
i +0.5, -0.5  +0.5, -0.5 —0.5, +0.5 +0.5, —0.5 
5 +1, -1 -1 +1 +1, —1 +1, —1 
3 —1.5, +1.5 +1.5, 一 1.5 +1.5, 一 1.5 十 1.5 一 1.5 
条 件 概率 1/8 1/8 1/8 1/8 
T; 的 值 0 而 1$ 12 


T, 取 各 个 值 的 概率 是 : 
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k: P(Q., = 1, Q = 2, Qs = 3) 
H T 1⁄8 表示 给 定 Q, ,8, ,2; 的 秩 时 的 T, 值 的 条 件 概率 、 假 设 考虑 给 Q , Q, 一 个 
ARAKERE, W Q, =2,0Q, =1,0, =3， 那 么 ， 如 同 我 们 刚才 所 做 的 ， 通 过 列 出 së 
的 8 个 排列 ， 读 者 很 容易 再 一 次 验证 .我 们 又 看 到 T 的 8 个 同样 的 值 ， 且 这 8 个 值 
每 个 都 有 概率 
F: P(Q, = 2; Q = 1, Qs = 3) 

计算 Q, ,2, ,CQ, 中 所 有 6 种 (3!) 置换 排序 方式 ， 我 们 可 以 得 到 T, 所 取 各 个 值 的 总 
概率 : 1/8， 因 此 ， 为 了 计算 工 的 零 分 布 ， 我 们 这 里 仅 需 要 考虑 一 种 情形 ，@, =i,i= 
1,2,3. 因此 通过 计数 T, 取 各 个 等 值 的 数目 ， 而 得 到 T, 的 概率 分 布 

P(T; = 0) =1⁄4, P(T;y=ñ)=1⁄4 P(T,=1ġ)=1/4 PT = 12) = 1/4 

根据 中 心 极限 定理 ， 我 们 可 以 用 下 分 布 或 x 分 布 作为 T, T, T, 的 近似 分 布 ， 由 
于 有 些 知识 细节 超出 了 本 书 的 范围 ， 因 此 我 们 省 略 掉 近似 分 布 的 整个 推导 过 程 ， 读 
者 可 以 参考 著作 Quade(1972 ,1979 ) 或 Lawler( 1978) 了 解 T, ,Iman 和 Davenport( 1979 ) 
Yf T,, 以 及 Friedman( 1937) 了解 T,. 口 

前 面 所 得 到 的 7 ,T,,T, 的 假设 都 是 基于 H, 为 真 的 情形 ， 如 果 H, 是 假 的 ， 那么 
处 理 和 5; 及 R, 可 能 分 别 与 它们 的 平均 值 0 和 b(k+1)/2 有 较 大 区 别 ， 使 得 3 个 统计 
量 的 值 趋 于 增加 ， 因 此 我 们 的 判决 法 则 就 是 : 如 果 T ,7,7T 的 值 很 大 ， 则 拒绝 零 假 
Ù H,. 

只 有 当 数 据 服从 方差 相同 的 正 态 分 布 时 ， 我 们 才能 用 参数 方法 分 析 来 自 随 机 化 
的 完全 区 组 设计 的 数据 ， 零 假设 为 : 在 同一 个 区 组 中 的 随机 变量 具有 相同 的 均值 . 
检验 统计 量 为 
_ _ (b-1)SSB 


Ty — SSB — SSR HI 
其 中 
_ 1. T 
SSB = pT ” (18) 
1 b k 2 T2 
sR- i> (> xj] 二 (19) 
b k T? 
SST = >: ÈX — + (20) 
i=] j=] 
b 
T, = >; X;; (21) 
i=] 
和 
b k 
T = > 2, Xi (22) 
i=1 j=1 
并 将 (17) 式 中 的 统计 量 和 表 A22 中 得 出 k, =k-1,k,=(b-1)(k-1)É Fa 
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的 分 位 数 进行 比较 . 

如 果 我 们 使 用 秩 R(X, ) 替代 数据 计算 得 到 这 个 下 统计 其, 则 得 到 的 统计 量 和 世 
一 样 ;， 如 果 使 用 加 权 的 秩 5S, 兰 代数 据 计 算得 到 FF 统计 量 ， 则 得 到 统计 量 T, 对 有 结 
的 调整 也 就 自动 体现 在 F 统计 量 T, rR. 我 们 这 里 描述 的 多 重 比 较 方法 只 是 一 个 参数 
方法 ， 称 为 Fisher 最 小 显著 差异 方法 (LSD) ， 但 是 ， 它 是 通过 用 SRE R(X) Æi 
算 的 ， 而 不 是 用 数据 . 

对 于 两 个 样本 (k=2)， 相 对 于 通常 的 参数 检验，Friedman 检验 的 A. R. E. 与 
符号 检验 相同 ， 即 2/x =0.637， 这 里 1 检验 是 最 有 功效 的 检验 ， 对 于 个 样本 的 情 
况 ，Friedman 检验 相对 于 下 检验 的 A. R. E. 依赖 于 样本 个 数 k， 如 果 总 体 服从 正 态 分 
布 ， 则 A. R.E. 等 于 0.955k/A(k+1); 如 果 总 体 服从 均匀 分 布 ， 则 A. R. E. FA kK 
(k+1); 如 果 总 体 服从 双 指 数 分 布 ， 则 A. R E 等 于 3k/2(k+1). 在 纯 漂 移 型 的 备 
择 假设 下 ，Friedman 检验 相对 于 常用 的 下 检验 总 不 会 小 于 0. 864k/(k+1). Noether 
(1967a) 完整 地 讨论 了 Friedman 检验 的 A. R. E. 问题 . 

对 于 k=2， 当 分 布 为 正 态 分 布 时 ，Quade 检验 相对 于 通常 的 参数 上 检验 的 
A. R.E. 与 Wilcoxon 符号 秩 检验 相同 ， 即 3/x =0.955. 对 于 Wilcoxon 检验 ， 它 相对 
于 上 检验 的 A. R E 从 不 小 于 0.864, 但 是 可 能 达到 无 穷 . 对 于 两 个 样本 以 上 的 情形 ， 
Quade 检验 的 A. R. E. 还 未 解决 ， 但 是 可 以 使 用 模拟 的 方法 (Iman et al ,1984) ， 结 果 
表明 ， 当 处 理 数 等 于 或 大 于 5 时 ，Quade 检验 不 如 Friedman 检验 有 效 . 


入 有 序 备 择 假设 的 Page 检验 


在 5.4 节 中 ， 对 于 指定 了 处 理 效应 顺序 的 备 择 假设 ， 我 们 给 出 了 大 个 独立 样本 情 
况 下 的 Jonckheere-Terpstra 检验 ， 它 等 价 于 计算 观测 值 和 备 择 假设 中 指定 处 理 次 序 间 
的 Kendall +7， 顺便 提 一 下 ， 我 们 也 能 较 好 地 利用 Spearman p. 

在 随机 化 的 完全 区 组 设计 中 ，Spearman p 用 于 检验 大 个 相关 样本 ， 其 中 ， 备 择 假 
设 为 处 理 效应 服从 指定 的 顺序 ，Page(1963 ) 介绍 了 Friedman 区 组 内 排序 与 备 择 假设 
H, 中 指定 处 理 排序 间 的 相关 性 在 检验 中 的 应 用 . 

由 于 数据 中 往往 有 许多 结 ，Page 使 用 了 一 个 比较 简单 的 统计 量 ， 如 果 在 没有 结 
的 情况 下 ， 它 是 一 个 关于 Spearman p 的 单调 函数 ， 即 


k 
Ta = X jR, = Ri + 2R; + .十 KR 
j=l 


其 中 ，R 表示 Friedman 检验 中 的 处 理 的 秩 和 ， 备 择 假设 H, 指定 处 理 效应 按照 升 
序 排列 . 

虽然 Page(1963 ) 给 出 了 精确 表 ， 但 是 我 们 在 此 仅 考虑 其 大 样本 通 近 ， 对 水 平 为 
a 的 右边 检验 ， 当 


T = — Ti — bk(k+ 1⁄4 
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超过 标准 正 态 分 布 的 1 -a 分 位 数 时 (由 表 Al1) ， 则 拒绝 H, StatXact 可 以 计算 出 

Page 检验 中 精确 的 产值， 一 一 人 

例 5.8.3 

健康 研究 者 推测 有 规律 的 运动 可 以 降低 人 休息 时 的 心率 ， 为 了 检验 这 一 理论 ，8 名 

平时 不 经 常 运 动 的 健康 志愿 者 参加 了 一 个 试验 ,在 监督 下 进行 有 规律 的 运动 ， 在 项 

目 开 始 时 测量 他 们 休息 时 的 心跳 ， 此 后 每 一 个 月 测量 一 次 ， 持续 4 个 月 . 

零 假 设 是 : 没有 差异 
Ho: HI = pH2 = Ma = Ma = Ms 
有 序 备 择 假设 为 : 


Hr: hi 和 pp < us Eu S us 


其 中 , ,是 4 个 月 结束 后 的 均值 ，js 是 初始 均值 ， 在 H, 中 ， 至 少 有 一 个 严格 不 等 


式 成 立 . 
观测 到 的 心率 以 及 它们 的 Friedman 区 组 内 的 秩 如 下 所 示 


人 初始 值 第 1 个 月 第 2 个 月 第 3 个 月 第 4 个 月 


1 82(4) 84(5) 77(2) 76(1) 79(3) 
2 80(4.5) 80(4.5) 76(1.5) 76(1.5) 78(3) 
3 75(3) 78(5) 77(4) 74(2) 72(1) 
4 65(1.5) 72(5) 68(4) 65(1.5) 66(3) 
5 77(5) 74(2) 72(1) 75(3.5) 75(3.5) 
6 68(4) 69(5) 65(2) 66(3) 64(1) 
7 70(3.5) 74(5) 68(1.5) 70(3.5) 68(1.5) 
8 77(4) 76(3) 78(5) 72(2) 70(1) 


Rs=295 R =345 R=2 R=18 R=17 
注意 ，R, 是 备 择 假设 中 预测 的 最 小 的 秩 和 ，R, 是 备 择 假设 中 预测 的 第 二 小 的 秩 和 ， 
依 此 类 推 . 

T4 = 17 + 2(18) + 3(21) + 4(34.5) + 5(29.5) = 401.5 
__401.5—8(5)(36)/4 _ 415 _ 


1⁄2 
[s6 一 syaa | 


KT, 与 表 Al 中 的 值 相 比 较 得 p =0.002, MÆ a =0. 05 的 水 平 上 拒绝 H,， 当 没有 结 
Hf, Page 构造 的 精确 表 也 给 出 了 同样 的 p- 值 . 
我 们 也 可 以 代替 Spearman p 使 用 Kendall r( Jonckheere ,1954b). Shorak( 1967 ) 和 
Pirie ,Hollander( 1972 ) 对 相同 的 假设 给 出 了 其 他 的 非 参 数 检验 方法 . m= 
下 面 的 讨论 表明 Friedman 检验 统计 量 和 其 他 一 些 常用 的 非 参 数 统计 量 有 着 密切 
的 关系 ， 为 了 简便 ， 下 面 的 讨论 仅 限于 没有 结 的 情况 . 对 存在 结 的 情况 ,我们 可 以 
进行 类 似 的 比较 . 
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与 Kendall 协调 系数 的 关系 


Kendall 和 Babington-Smith ( 1939) 以 及 Wallis ( 1939 ) 分 别 独立 地 介绍 了 统计 量 
W, H Kendall 协调 系数 . 它 可 以 应 用 于 Friedman 检验 统计 量 应 用 的 相同 情况 ， 尽 
管 起 初 可 能 想 把 它 作 为 b 个 区 组 中 “ 秩 一 致 性 ”的 度量 ,而 不 是 一 个 检验 统计 量 . 
用 与 前 面相 同 的 符号 ，Kendall W 定义 如 下 : 


— 
| 


如 果 在 b 个 区 组 中 的 秩 完全 一 致 ， 那 么 处 理 1 在 全 部 b 个 区 组 中 得 到 相同 的 秩 ， 处 理 
2 在 全 部 b 个 区 组 中 也 得 到 相同 的 秩 ， 依 此 类 推 ， 此 时 得 到 W 的 值 等 于 1.0.， 如 果 秩 
中 有 “明显 的 不 和 谐 ”， 则 R 的 值 要 么 相等 ， 要么 相互 十 分 接近 ， 且 接近 于 它 的 均 
值 ， 因 此 Ww 将 等 于 0 或 非常 接近 于 0 
比较 Kendall W 和 由 (5) 式 导 出 的 Friedman 检验 统计 量 ， 我们 可 以 得 到 如 下 
关系 
T 


i i 


因此 ，W 只 是 Friedman 检验 统计 量 的 一 个 简单 的 变形 ， 对 于 任何 用 W 作为 检验 统计 
量 的 假设 检验 都 可 以 用 计算 T, RW. WRT 超过 了 它 的 零 分 布 的 1 -a 分 位 数 ， 
则 W 也 会 超过 它 自身 零 分 布 的 1 - a 分 位 数 ，Minitab ,StatXact 和 SPSS 都 有 计算 W 的 
程序 . 


与 Spearman p 的 关系 


H (5.4.4) 式 定义 的 Spearman p， 可 以 在 两 个 区 组 之 间 进 行 计算 ， 例 如 区 组 i 
和 区 组 m， 将 这 两 区 组 作为 两 个 样本 来 考虑 ， 且 将 在 每 个 处 理 之 下 的 两 个 秩 看 作 是 
一 对 相关 的 秩 ， 对 所 有 区 组 对 的 Spearman p 的 平均 值 和 Friedman 检验 统计 量 有 一 个 
直接 关系 ， 我 们 现在 来 验证 . 

i p, 为 Spearman p 的 平均 值 ， 即 要 对 8(b-1) 个 pw 的 值 求 平 均 ， 因 为 即使 由 对 
称 性 有 p，=p。,， 也 要 计数 pw 和 pw 的 个 数 ， 为 了 计算 p 的 平均 值 ， 我 们 将 对 所 有 的 i, 
m 求 和 ， 然后 减 去 当 i 和 m 相等 时 的 pu; 即 我 们 要 减 去 和 自己 配对 区 组 的 p 值 . 共 
有 4b 个 情况 下 的 pi 等 于 1， 因 此, p 的 平均 值 表示 如 下 : 

Pa 7 证 bb — 1) mÈ? > Pim 一 p) (25) 


如 果 秩 之 间 存 在 “完全 的 一 致 " ， 在 上 述 描述 的 意义 下 ， 因 为 每 个 pm 等 于 1， 所 以 随 
机 变量 p, 等 于 1， 如 果 秩 之 间 不 一 致 ，p。 将 小 于 1 或 甚至 会 有 负 值 然而， 除了 只 
有 两 个 区 组 (b=2) 这 一 特殊 情况 外 ，p。 不 可 能 小 于 -1. 

(25) AI Spearman p 的 定义 可 以 组 合并 简化 ， 以 揭示 出 它 与 (2) 式 给 出 的 


2 
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Friedman 检验 统计 量 T, 的 关系 : 
Pat. esas a: JP 
P G= Ik- b=1 
因此 ， 平 均 Spearman p 的 分 位 数 可 以 简单 地 从 Friedman 检验 统计 量 的 分 位 数 得 到 . 
上 述 的 Friedman 检验 统计 量 和 Spearman p 之 间 的 关系 说 明 ，Friedman 检验 可 以 
用 作 两 样本 情形 中 线性 相关 的 检验 ，Spearman p 已 用 在 这 个 检验 中 ， 尽 管 Friedman 
检验 统计 量 的 精确 分 布 可 以 很 容易 从 Spearman p 的 分 布 得 到 ，Spearman p 也 有 一 个 
对 小 样本 可 以 制 表 的 优点 . 两 个 检验 是 等 价 的 ， 因 此 ， 在 Pearson r 适用 的 情况 下 ， 
相对 于 通常 用 Pearson r 作为 检验 统计 量 的 参数 检验 ， 它们 两 个 的 A.R. E. 都 
是 0. 912. 


每 个 试验 单元 中 几 个 观测 情形 的 推广 


如 果 在 每 个 区 组 内 ， 每 个 处 理 有 几 个 (m) 观测 ， 而 不 是 像 以 前 每 个 试验 单元 
只 有 一 个 观测 的 情形 ， 处 理 之 间 没 有 差异 的 零 假设 将 由 稍微 修改 的 Friedman 方法 来 
检验 ， 像 前 面 一 样 ， 对 每 个 区 组 内 的 观测 进行 排序 ， 不 同 的 是 ， 秩 从 1 到 mk， 如 前 ， 
秩 R, 的 和 定义 为 赋 给 所 有 观测 (包括 处 理 j) 的 秩 和 .在 区 组 i 中 用 处 理 j 的 观测 记 
为 XA Xo, Xim R, 的 均值 变 为 


(26) 


S mk + 1 
E(R;) = R(X;;,)] = 
(R 2 2 ERX) x (27) 
B y> münk + 1) = +1) 
i=} 
由 定理 1.4.5， 可 求 得 R 的 方差 OXE n H m IÇ, N 由 mk 代替 ) 如 下 : 
b n 5. m(mk + 1)(mk 一 m) 
Var (R) = >` V R(x,) | = > 一 一 一 一 一 一 一 
a(R) = È Var | È Roc |= et a 
_ bm°(mk + 1)(k — 1) 
12 
如 果 数 据 中 有 结 ， 则 Var(R,) 给 出 如 下 : 
Var (Ri) = Lalim P R(X;;,)° — mkb(mk + wa (29) 
六 k(mk- 1) "gn ijn 
对 所 有 的 j， 它 是 相同 的 . 
这 里 用 到 检验 统计 量 
E(R )]Ë 
T= vk- Kk— e-on- rep (30) 


j=l Var (R;) 
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HEP, R 的 均值 和 方差 如 上 给 出 ， 像 以 前 一 样 ， 要 用 到 自由 度 为 k-1 的 Xx 分 布 表 . 
多 重 比较 用 下 列 不 等 式 


= : 1/2 
2kb(mk — 1) Var (R) f T, ] 三 


IR; 一 Ri| > 和 -72 k —l(mbk-k-—b+1)|  b(mk — 1) 
oh, ír. 是 自由 度 为 mpk -大 -b+l 的 :分 布 的 1 - a/2 分 位 数 ， 它 可 从 表 A21 中 
得 到 . 


交互 作用 


据 我 所 知 ， 对 交互 作用 ， 没 有 什么 好 的 、 精 确 的 非 参数 方法 . 精确 的 检验 或 
者 要 求 当 区 组 效应 被 区 组 内 Friedman 型 秩 消 除 时 (例如 见 Patel 和 Hoel,1973) ， 处 
理 之 间 没 有 差异 , 或者， 它们 是 基于 观测 条 件 是 “条 件 分 布 自由 的 ". 后 面 一 组 检 
验 有 过 多 的 计算 量 ， 且 包含 列 秩 检 验 ， 其 中 ， 通 过 从 观测 中 减 掉 处 理 均值 或 中 位 
数 来 “消除 ”处 理 效 应 ， 通 过 在 区 组 内 排序 或 者 从 观测 中 减 掉 区 组 均值 或 中 位 数 
来 消除 区 组 效应 .根据 好 的 功效 和 应 用 方便 ， 对 这 些 列 秩 检 验 的 大 样本 通 近 ， 尽 
管 不 是 真正 的 非 参 数 检验 ,但 也 是 参数 方法 中 最 好 的 选择 ， 它 们 降低 了 非 正 态 分 
布 带 来 的 功效 问题 ， 且 当 每 个 单元 的 观测 趋 于 无 穷 时 ， 它 们 是 渐 近 分 布 自由 的 . 
为 了 对 交互 作用 的 一 些 最 好 的 列 秩 检 验 进 行 很 好 的 比较 ， 可 参见 Mansouri 和 Chang 
(1995 ) . 

如 果 备 择 假设 指定 有 处 理 效应 的 排序 ， 那 么 一 些 双 向 表 秩 和 检验 的 参考 书目 
包括 Page ( 1963 ) , Hollander( 1967b ) ， 和 Pirie ( 1974); 对 于 多 重 比 较 ， 有 Dunn 
(1964) 以 及 McDonald 和 Thompson( 1967 ) . Doksum( 1967 ) , Puri 和 Sen(1967 ) , Sen 
(1968b) 以 及 Lemmer, Stoker 和 Reinach ( 1968 ) 建议 了 其 他 分 析 方 法 ，Mehra 和 
Sarangi( 1967) 以 及 Sen( 1967a) 研究 了 渐 近 效率 . 小 样本 效率 则 由 Gilbert(1972 ) 研 
究 . 由 Gerig(1969 ,1975 ) 考虑 了 多 元 情形 的 推广 .Koch(1970 ) 讨 论 了 每 个 单元 格 
有 几 个 观测 的 裂 区 变 差 . Li 和 Schucany( 1975 ) 以 及 Schucany 和 Beckett(1976 ) 考虑 
了 度量 两 个 集合 区 组 秩 之 间 的 协调 性 . 应 用 到 双向 表 ， 且 比 Friedman 检验 有 更 高 
A. R. E. 的 “ 列 秩 ”方法 的 完整 表达 ， 可 以 参看 Lehmann ( 1975). Hora 和 Iman 
(1988) 给 出 了 列 秩 检验 和 Friedman 检验 的 A. R. E. 的 比较 ， 有 兴趣 的 读者 也 可 以 
参见 5.12 节 ， 


SIar 
习题 


l. 对 某 城市 的 所 有 7 所 医院 做 调查 ， 得 到 出 生 12 个 月 以 上 婴儿 的 人 数 、 把 这 一 时 间 段 分 为 
4 个 季度 ， 去 检验 假设 4 个 季度 的 出 生 率 是 常数 . 
调查 结果 如 下 : 
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出 生 人 类 

医院 冬季 $F 夏季 aF 
A 92 112 94 77 
B 9 11 10 12 
C 98 109 92 81 
D 19 26 19 18 
E 21 22 23 24 
F 58 71 51 62 
G 42 49 +4 41 


(a) 用 Friedman 检验 分 析 这 些 数据 . 

(b) 用 Quade 检验 分 析 这 些 数据 ， 

(c) 你 能 说 明 这 两 个 检验 结果 中 大 的 差异 吗 ? 

2. 随机 选择 12 个 学 生 参 加 一 个 学 习 试 验 ， 试 验 者 制作 了 4 组 单词 ， 每 组 包含 有 20 对 单词 ， 

但 是 ， 在 这 4 组 中 用 不 同 的 配对 方法 ， 每 个 学 生 拿 一 组 ， 给 他 们 5 分 钟 去 学 习 ， 然 后 检查 

他 或 她 的 记忆 单词 的 能 力 ， 对 每 个 学 生 将 这 个 方法 对 所 有 4 组 单词 重复 ， 组 的 顺序 从 一 

个 学 生 转 到 下 一 个 . 测验 的 得 分 如 下 (20 是 满分 ). 

学 生 


组 1 2 3 4 5 6 7 8 9 10 11 12 
1 1 7 13 15 12 11 15 10 14 9 8 10 
2 14 6 14 10 11 9 16 8 12 9 6 1 
3 16 5 16 12 12 9 10 11 13 9 9 13 
4 20 10 17 14 18 16 14 16 15 10 14 16 

有 些 组 单词 比 其 他 组 容易 记 吗 ? 

(a) 用 Friedman 检验 . 

(b) 用 Quade 检验 . 


3. 用 TT 重新 做 例 5.8.2， 并 比较 p- 值 . 

4. 用 一 个 测 力 计 度量 机 动车 的 一 氧化 二 氮 散 发 速率 ， 司 机 在 15 分 钟 时 间 内 遵循 固定 的 加 速 
度 、 减 速度 等 规则 .为 了 看 由 于 不 同 的 司机 ， 度 量 是 否 不 同 ,对 6 个 机 动车 进行 重复 检 
验 ， 每 个 站 有 3 个 司机 ， 结 果 如 下 . 

司机 
车 1 2 3 

6.2 6.3 6.0 

126 129 12.7 

10.2 10.6 9.8 

130 13.1 13.0 

5.6 5.9 5.5 

8.1 8.1 7.8 
某 些 司 机 倾向 于 比 其 他 司机 得 到 更 低 的 速率 吗 ? 是 哪个 司机 ? 

5. Fox 和 Randall( 1970) ,Hollander 和 Wolfe( 1973) 所 做 的 一 个 试验 想 说 明 ; 增加 重量 会 减少 
物体 的 前 辟 颤 动 频率 ， 测 量 了 6 种 物体 ， 每 种 都 有 5 个 不 同 的 重量 ， 测 量 前 臂 题 动 频率 的 


数据 如 下 . 问 这 些 数据 支持 这 个 理论 吗 ? 


CN Q $> G) 2 >> 
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重量 (1b.) 
物体 0 125 2.5 5 7.5 
1 3.01 285 262 263 258 
2 347 343 315 283 270 
3 3.35 314 30 271 278 
4 3.10 286 258 249 236 
5 341 332 30 2.96 2.67 
6 307 306 285 250 2.43 


6. 对 下 面 的 数据 用 StatXact 来 解释 Page 检验 . 人 们 期 望 : 降低 应 用 于 棉 植物 的 碳酸 钾 水 平 
能 倾向 于 增加 光纤 的 强度 .5 个 不 同 剂量 的 水 平 应 用 于 3 个 不 同 区 组 . SratXact 给 出 p = 
0. 0025. 这 和 你 的 分 析 怎 么 比较 ? 
碳酸 钾 的 水 平 (Ib/ 英 亩 ) 
区 组 144 108 72 54 36 
746 7417 776 814 763 


768 757 773 815 8.00 
721 7.80 7.74 787 793 


@ N = 


思考 题 


l. 对 k=2, 证 明 统 计量 T, 是 由 (5.7.5) 式 给 出 的 Wilcoxon 符号 秩 检验 统计 量 的 函数 ， 因 
此 ， 两 个 检验 是 等 价 的 (提示 : 首先 证 明 Q, 等 于 R, 的 绝对 值 ). 
2. 对 k=2， 证 明 Friedman 检验 等 价 于 双边 符号 检验 (用 大 样本 逼近 ). 
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fE 5. 8 节 开 头 所 描述 的 随机 的 完全 区 组 设计 中 ,每 一 个 区 组 都 应 用 每 一 个 处 理 . 
但 是 在 现实 中 ， 往 往 很 难 做 到 在 每 一 个 区 组 中 应 用 所 有 的 处 理 ， 特 别 是 当 处 理 的 数 
量 较 大 ， 而 区 组 的 大 小 有 限时 . 例如， 如 果 需 要 品尝 20 种 食品 ， 而 每 个 品尝 者 〈 区 
组 ) 往往 发 现实 际 上 很 难 对 这 20 种 食品 进行 精确 的 排序 . 但 是 如 果 使 用 4 倍 的 人 
(或 者 每 个 人 用 4 次 ) ， 而 每 一 个 人 只 需 品尝 5 种 食品 ， 那 么 评判 起 来 就 会 更 加 容易 
和 精确 ， 像 这 样 的 试验 设计 ， 每 一 个 区 组 中 没有 用 所 有 的 处 理 就 叫做 不 完全 的 区 组 
设计 ， 而 且 ， 如 果 设 计 满 足下 述 条 件 ， 我 们 就 称 它 是 平衡 的 〈balanced) 不 完全 区 组 
设计 : (1) 每 一 个 区 组 包括 大 个 试验 单元 ，(2) 每 一 个 处 理 出 现在 ~ 个 组 中 ，(3) 每 
一 个 处 理 与 其 他 处 理 出 现 的 次 数 相同 . 

Durbin( 1951 ) 提出 了 一 个 秩 检验 可 以 用 于 检验 平衡 的 不 完全 区 组 设计 中 的 零 假 
设 ， 即 不 同 的 处 理 间 没有 显著 差异 .我们 已 有 一 些 参数 方法 来 分 析 用 平衡 的 不 完全 
区 组 设计 所 得 的 数据 ， 这 些 方法 都 是 基于 正 态 分 布 的 假设 基础 上 的 ， 我 们 这 里 不 做 
更 多 的 解释 . 如果 正 态 分 布 的 假设 无 法 得 到 满足 ， 而 且 我 们 想 要 简单 的 分 析 方 法 ， 
或 者 我 们 得 到 的 观测 只 有 秩 的 话 ， HAZ Durbin 检验 往往 比 参 数 方法 更 受 欢 迎 ， 如 果 
处 理 数 和 每 个 区 组 中 试验 单元 数 相等 ， 那 么 Durbin 检验 可 以 简化 为 Friedman 检验 . 
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如 果 所 给 的 第 3 个 条 件 不 是 完全 满足 ，Durbin 检验 在 大 多 数 情况 下 仍然 有 效 . 
> Durbin 检验 


数据 ”我 们 这 里 使 用 如 下 符号 . 

t= 所 考查 的 处 理 数 . 

k= 每 一 个 区 组 中 试验 单元 数 (k <t). 

b= 区 组 总 数 . 

r= 每 一 个 处 理 出 现 的 次 数 (r <b). 

A= 区 组 中 同时 出 现 第 i 个 处 理 和 第 j 个 处 理 的 区 组 数 ，( 对 于 任意 一 对 处 理 ，A 

的 值 相 等 . ) 

把 数据 配置 在 上 面 定义 的 平衡 的 不 完全 区 组 设计 中 ， 并 令 X, 代 表 区 组 i 中 处 理 j 
的 结果 (车 处 理 j 出 现在 区 组 i 中). 

设 每 个 区 组 中 只 有 大 个 观测 结果 ， 且 给 每 一 个 区 组 中 的 X; 赋 以 秩 ， 其 中 秩 1 WÁ 
给 区 组 i 中 最 小 的 观测 值 ， 秩 2 赋 给 区 组 i 中 第 二 小 的 观测 值 ， 依 此 类 推 直到 kk， 表 
示 区 组 i 中 最 大 观测 值 的 秩 .， 如 果 XX, 存 在 ， 则 记 R(X) A X AIE. 

计算 第 j 个 处 理 下 的 7 个 观测 值 的 秩 和 ， 并 记 这 个 和 为 Rj， 则 R, 可 写成 


b 
Ri = > R(Xi) (1) 


其 中 ,在 处 理 j F, R# r+ R(X,) 的 观测 值 存在 ， 因 此 R, 只 是 -个 项 的 秩 和 . 

如 果 观 测 值 不 是 数值 ， 但 可 以 根据 某 些 感 兴 趣 的 原则 ， 在 区 组 内 对 对 象 进行 排 
序 ， 赋 予 每 一 个 观测 以 相应 的 秩 ， 并 如 上 计算 出 Rj,j=1,2,…,t. 

如 果 由 于 某 些 观测 值 相 等 导致 有 几 种 不 同 的 赋 秩 方法 ， 则 我 们 推荐 运用 赋 平 均 
秩 到 每 个 有 结 观测 的 方法 ， 这 个 方法 可 能 会 改变 统计 量 的 零 假 设 ， 但 是 如 果 结 的 数 
量 不 多 的 话 ， 可 以 忽略 其 影响 . 
假定 条 件 

1. 区 组 相互 独立 . 

2. 每 一 个 区 组 中 观测 值 具有 次 序 度量 尺度 ， 结 不 会 导致 出 问题 . 
检验 统计 量 ”Durbin(1951) 建 议 使 用 如 下 检验 统计 量 


_ 12G0-1 < -tny 
n= k- DE+D) 2 (a 2 2 


如 果 区 组 中 存在 结 ， 则 使 用 赋 平 均 秩 的 方法 ， 并 进行 调整 . i A 为 秩 与 平均 秩 的 平 
方 和 ， 


[R(X,)]° (3) 


i=} j=1 
同时 计算 “校正 因子 ”C 如 下 


2 
= bk(k + 1 (4) 


s 4 
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由 于 存在 结 ， 调 整 后 的 统计 量 T, ER: 


2 ! 
e- (r-H) «-D|Zr-rc] 
_ > 


sss s s 6 


另外 一 个 等 价 的 方法 是 在 秩 与 平均 秩 上 使 用 通常 的 方差 分 析 法 . 这 样 就 得 出 了 
下 面 的 统计 量 7,， 它 仅 是 T, 的 一 个 函数 ， 最 近 的 研究 表明 ，T 的 近似 分 位 数 比 7 
的 更 精确 一 些 ， 因 此 人 们 更 愿意 使 用 统计 量 T. 
Tı/(t-1) P 

(bk — 1) — T;)/ (bk — b — t + 1) 

总 的 来 说 ， 用 T 作为 检验 统计 量 ， 首 先 要 计算 统计 量 T, ， 如 果 没 有 结 ， 就 使 用 (2) 
式 ; 如 果 有 结 ， 则 使 用 (3), (4), (5) R 
零 分 布 H OTT, (sk T,) 的 精确 分 布 很 难 求 出 ， 我 们 往往 使 用 它们 的 逼近 分 布 . 了 
的 逼近 分 布 是 一 个 自由 度 为 上 -1 的 x 分布， 这 个 通 近 分 布 趋向 于 保守 .也 BJ B H Yr 
布 是 一 个 自由 度 为 后 =t-l1,k,=bk-b-t+1 BJ F Yf (Mak A22), KA 3BL r Al 
倾向 于 给 出 一 个 膨胀 的 a 值 ， 但 是 比 T, 更 加 接近 所 需要 的 值 
假设 


T3 


Ho: 每 一 个 区 组 中 ， 所 有 随机 变量 的 赋 秩 都 是 等 可 能 的 ( 即 处 理 
有 相同 的 效应 ) 
多 :至 少 有 一 个 处 理 倾向 于 产生 比 至 少 一 个 其 他 处 理 有 较 大 的 观 
测 值 
如 果 T, 大 于 由 表 A22 查 出 的 下 分 布 的 1 -a 分 位 数 ， 其 中 自由 度 为 k =r-1, 
k, = 次 -=-t+l1， 则 我 们 以 近似 水 平 a 拒绝 Ho RHET AAK A22 得 到 近似 
的 p- 值 . 
多 重 比 较 ”如 果 检 验 中 拒绝 了 零 假 设 ， 则 可 以 使 用 处 理 对 间 的 多 重 比 较 ， 过 程 如 下 . 
考虑 处 理 i 和 处 理 j， 如 果 它 们 的 秩 和 R, 与 R 满足 如 下 不 等 式 : 
NO (A= C J. T A 
IR; — R| > f-a/2 a (4 ao) (7) 
则 认为 处 理 i mA ARAE, Oh, ACHT, H (3), (4), (5) 式 给 出 ， 
i. 是 自由 度 为 多 -bt+1 的 + 分 布 的 1 - a 分 位 数 ， 它 可 以 从 表 A21 得 到 ， 如 果 
没有 结 , WJ (7) 式 可 以 化 简 为 
1/2 
bk -| (8) 


|R; — Rj| > h-,⁄2 [a | 
计算 机 辅助 ”对 平衡 的 不 完全 区 组 设计 的 分 析 ， 可 以 首先 在 每 一 区 组 中 将 数据 转化 
为 秩 ， 然 后 应 用 软件 中 的 相应 计算 机 程序 进行 计算 ,如 SAS 中 用 于 秩 上 的 参数 平衡 
的 不 完全 区 组 设计 程序 ， 或 是 Minitab, SPSS, SAS 中 用 于 秩 上 的 广义 线性 模型 的 计算 
程序 . < 
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例 5.9.1 

假设 冰淇淋 生产 厂商 希望 测试 7 种 不 同 口 味 的 冰淇淋 受 人 们 喜欢 的 程度 ， 他 让 每 一 

个 受 测试 者 品尝 3 种 不 同 的 冰淇淋 ， 并 用 1 ,2,3 将 其 赋 秩 ， 秩 1 代表 最 喜欢 的 种 类 . 

为 了 设计 一 个 试验 ,使 得 每 一 种 冰淇淋 被 品尝 的 次 数 相同 ,我们 使 用 了 Youden 方 

RE (Federer,1963) 来 编排 .7 个 人 分 别 品尝 了 3 种 不 同 的 冰淇淋 ， 得 到 的 排序 结果 
如 下 : 


种 类 
A M O. SO O. l Q 
O S 3 1 
2 3 1 2 
3 2 1 3 
4 Ë 2 3 
5 3 1 9 
f 3 1 2 
0 
R= 8 9 4 3 5 6 7 


在 这 个 试验 中 ， 

t =7 = 冰淇淋 种 类 的 总 数 

k =3 = 一 次 所 比较 的 冰淇淋 种 类 的 数量 

b=7 = 品尝 者 (区 组 ) 的 总 数 

r=3 = 每 一 种 冰淇淋 被 品尝 的 次 数 

À =1 = 每 种 冰淇淋 与 其 他 种 类 冰淇淋 比较 的 次 数 

因此 ， 这 是 一 个 平衡 的 不 完全 区 组 设计 ， 我 们 使 用 Durbin 的 方法 检验 零 假设 : 
7 种 冰淇淋 受 嘉 欢 的 程度 相当 ， 

因此 在 得 到 近似 水 平 a =0.05 下 ， 检 验 的 临界 域 对 应 着 T, 值 大 于 3. 58， 其 中 
3.58 为 自由 度 分 别 为 上 =t-1=6,k, =bk-b-t+1 =8 的 下 分 布 的 0.95 分 位 数 (由 
表 A22 获得 ). 

由 于 没有 结存 在 ， 我 们 首先 根据 (2) 式 ， 求 得 统计 量 T, : 


> | -Et 
n nk- DES i r] 


_ _(12)(6) P. n? SARET Za 
- spo I 6)? +(9-6)2 + + (7 — 6%] 
= 12 
然后 由 (6) 式 ， 得 到 统计 量 T, 
T1/(t — 1) 
2 (b(k—-1)—T)/(bk—b-—-t+1) 
1276 a 


= 04- 12)/8 
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H T T, 属于 临界 域 ， 故 拒绝 零 假 设 ， 由 表 A22 可 得 出 p- 值 小 于 0.01 . 

利用 (8) 式 得 到 的 多 重 比较 表明 ， 第 4 种 冰淇淋 比 第 3 种 和 第 7 种 更 受 喜 欢 ， 
而 第 3 种 冰淇淋 比 第 7 种 更 受 喜 欢 . 

注意 在 本 例 中 ，7 位 参与 者 品尝 冰淇淋 具有 很 好 的 一 致 性 ， 因 此 我 们 可 以 比 
较 容 易 地 找到 精确 的 p- 值 ， 每 一 位 品尝 到 第 4 种 口味 时 都 会 表示 他 更 加 喜欢 它 ， 
每 一 位 品尝 到 第 3 种 时 会 表示 除了 第 4 种 ， 他 会 更 喜欢 这 一 种 ， 而 每 一 位 品尝 到 
第 5 种 时 会 表示 除了 第 3 种 和 第 4 种 ， 他 会 更 喜欢 这 一 种 ， 依 次 类 推 .， 人 们 由 此 
达成 了 很 好 的 一 致 性 ， 即 冰淇淋 的 受 喜 欢 程度 由 强 至 弱 依 次 为 4,3,5,6,7,1,2. 
也 就 是 说 ， 如 果 冰 淇 淋 口 味 种 类 没有 差异 的 零 假 设 成 立 ， 则 对 每 一 个 人 来 说 ， 对 
于 他 所 品尝 的 3 种 冰淇淋 都 会 出 现 31 =6 种 等 可 能 的 排序 方式 ， 那 么 7 个 人 共有 
6' =279936 种 等 可 能 的 排序 组 合 ， 而 其 中 只 有 一 种 可 能 的 排序 出 现 了 ， 即 第 4 种 
最 受 喜 欢 ， 第 3 种 其 次 ， 等 等 . 但 是 ， 还 有 其 他 达成 一 致 方式 的 可 能 性 发 生 ， 如 
在 7 种 中 选 出 最 受 喜 欢 的 ， 然 后 在 其 余 6 种 中 选 出 次 受 嘉 欢 的 ， 等 等 ， 共 有 71 种 
可 能 达成 一 致 的 方式 ， 所 以 本 例 中 达成 一 致 的 概率 为 

P(T: 8) = PC = 8) = & = 0.018 


即 我 们 得 到 的 精确 的 p- 值 0.018， 它 略 大 于 由 表 A22 得 出 的 近似 p- 值 (小 于 
0.01)， 但 是 它 比 由 7 的 逼近 分 布 〈 即 自由 度 为 6 的 x 分 布 ) 所 得 到 的 近似 p- 什 
(大 于 0.05) 准确 得 多 . uÑ 
口 理论 Durbin 检验 和 Friedman 检验 的 理论 发 展 十 分 相似 ， 因 为 在 处 理 间 无 差异 的 堆 
假设 下 ， 区 组 内 大 个 秩 的 排列 方式 是 等 可 能 出 现 的， 因此 可 以 求 得 Durbin 检验 统计 量 
的 精确 分 布 ， 在 每 一 个 区 组 中 有 k! 种 等 可 能 的 秩 排 列 方式 ， 共有。b 个 组 ， 因 此 从 5 个 
区 组 的 总 体 来 看 ， 因 为 共有 (k1)° 种 可 能 不 同 秩 的 排列 方式 ， 且 每 一 种 秩 的 排列 方式 
都 是 等 可 能 的 ， 出 现 的 概率 为 /(k!)*” 如 同 前 一 节 中 的 Friedman 检验 一 样 ， 对 每 一 种 
排列 方式 ， 计 算 Durbin 检验 统计 量 ， 从 而 确定 它 的 分 布 函数 . 

在 许多 情况 下 ， 求 Durbin 检验 统计 量 T, 的 精确 的 分 布 不 太 实际 ， 所 以 如 果 每 一 
种 处 理 的 重复 数 r 比较 大 ， 它 的 分 布 往往 由 自由 度 为 +- 1 的 x 分 布 逼近 ， 我 们 对 这 
个 逼近 进行 调整 如 下 : 

如 果 每 一 种 处 理 的 重复 数 + 比较 大 ， 那 么 根据 中 心 极限 定理 ,第 j 个 处 理 下 的 秩 
和 R, 可 以 逼近 正太 分布， 因此 随机 变量 

Ri — E(R) 


| Var (Rj) 


近似 服从 标准 正 态 分 布 ， 正 如 前 一 节 所 述 ， 如 果 R 是 独立 的 ， 那 么 统计 量 
L [Rj — E(R)}? 


TY 
2 Var (Ri) (9) 
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TEE EE t MARERA 分 布 〈 自 由 度 为 1) 的 随机 变量 的 和 ， 则 TAE 

服从 一 个 自由 度 为 z 的 好 分布， 但是， 这 里 只 并 不 独立 ， 它 们 的 和 为 一 定 值 : 
ZR = ma D (10) 

PE E EEEE ES a EE ET 

HO -1)/7 RA TRIAR, CRA B HEK -1 的 x 分 布 ， 其 形式 表 

示 为 

(11) 


为 了 把 (11) 式 转换 为 常见 的 由 (2) 式 给 出 的 形式 ， 我们 只 需要 找到 R, 的 均值 和 
方差 . 
秩 和 R, 为 独立 随机 变量 R(X,) 的 和 ， 


b 
Ri = 之 R(X;) (12) 


每 一 个 R(X,) 只 要 它 存 在 ， 就 是 从 整数 1 到 上 中 的 一 个 随机 选取 ， 因 此 ， 根 据 定理 
1.4.5， 可 以 得 到 R(X,) 的 均值 和 方差 如 下 : 


EIR(X)] = “二 (13) 
和 
Var [R(X;)] = — l (14) 
那么 ， 可 以 容易 地 求 得 R 的 均值 和 方差 为 : 
y= Y Ex, = (k + 1) 
E(R;) = 2 EIRX;)] =— (15) 
和 
b = 
Var (R) = > Var [R(X;)] = T (16) 
i=1 


将 R, 的 均值 和 方差 代 和 人 (11) 式 ， 得 到 ， 
t-14 [R — (k + 1) /2] 
x t S r(k+1)k- D/12 


12(t — 1) | 有- kan) 
“ktk 52 Š 2 q 


这 与 在 关于 Durbin 检验 的 解释 中 所 给 的 具有 同样 形式 . 

y 分 布 通 近 是 基于 每 一 种 处 理 的 重复 次 数 r 相当 大 这 一 假设 的 ,但 在 实际 情况 
中 ， 重 复 的 次 数 r 有 时 会 比较 小 ， 如 3 或 2， 此 时 如 果 用 X 分 布 允 近 ， 则 所 说 的 a 水 
平 可 能 并 不 是 很 精确 ， 而 如 果 应 用 基于 秩 的 方差 分 析 统 计量 五 (BD (6) 式 给 出 的 统 
计量 五 ) ， 则 所 说 的 a 水平 更 接近 真正 的 a 水平. 


Tı 
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( Benard 和 van Elteren ,1953) 已 把 Durbin 检验 推广 到 一 个 试验 单元 里 有 若干 个 观 
测 的 情形 ，Noether(1967a) 也 讨论 了 Durbin 检验 以 及 它 的 推广 ， 并 证 明了 Durbin 检验 
相对 于 它 的 参数 检验 情形 的 A.R. E. 与 Friedman 检验 相对 于 它 的 参数 检验 情形 的 
A. R. E. 相同 .Puri 和 Sen(1969b ) 讨论 了 成 对 比较 (k=2) 的 情况 . 口 


习题 


l. ”通过 试验 来 检验 7 种 类 型 轮胎 的 耐用 性 .一 般 认 为 最 好 的 试验 方法 是 观测 在 实际 驾驶 的 
情况 中 轮胎 的 表现 ， 但 是 ,一 次 只 有 4 个 轮胎 可 以 同时 进行 比较 ， 因 为 一 辆 汽车 只 有 4 个 
轮子 可 以 进行 试验 ， 因 此 ,试验 设计 采用 平衡 的 不 完全 区 组 设计 .对 7 位 司机 ， 每 一 位 
随机 地 选取 所 驾驶 汽车 的 4 个 轮胎 类 型 ， 并 在 试验 中 有 规律 地 轮换 .轮胎 在 必要 的 时 候 
进行 更 换 ， 根 据 更 换 的 顺序 赋 秩 给 原始 的 轮胎 . 


轮胎 类 型 

司机 1 2 3 4 5 6 7 
1 1 4 2 
2 1 3 4 2 
3 2 1 3 4 
4 1 2 4 3 
5 1 4 3 2 
6 2 4 1 3 
7 1 2 3 4 


结果 是 否 显示 出 耐用 性 有 显著 差异 ? (首先 检查 试验 是 否 服从 一 个 平衡 的 不 完全 区 组 设 
H). 如 果 耐 用 性 有 显著 性 差异 ， 那 么 ， 用 多 重 比 较 方法 确定 哪 一 个 轮胎 类 型 优 于 其 他 的 
轮胎 类 型 . 

2. 为 了 对 食肉 动物 进行 控制 ， 设 计 一 个 试验 用 于 确定 5 种 气味 哪 一 种 对 从 林 儿 更 有 吸引 力 . 
试验 者 已 经 发 现在 同一 时 间 至 少 存在 3 种 气味 才 会 迷惑 丛林 狼 ， 并 且 产 生 不 一 致 的 结果 . 
因此 ， 一 次 把 3 种 气味 放 在 一 个 大 的 开阔 地 的 不 同 地 方 ， 一 次 放出 一 只 从 林 狼 到 开阔 的 
地 方 ， 记 录 它 在 每 一 种 气 昧 的 地 方 停留 的 时 间 (以 秒 为 单位 ). 

根据 平衡 的 不 完全 区 组 设计 ， 轮 换 3 种 气味 ,得 到 如 下 结果 . 
气味 
丛林 狼 1 23 3 4 5 
14 


_ 
x= 
N 
Q 


2 17 4 2 
3 16 1 6 
i 42 10 0 
5 8 6 1 
6 22 31 0 
7 28 16 4 
8 15 7 4 
9 67 5 18 

10 6 16 1 
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这 是 一 个 平衡 的 不 完全 区 组 设计 吗 ? 不 同 的 气味 之 间 有 显著 差异 吗 ? 如 果 有 ， 哪 一 种 气 
味 优 于 其 他 的 气味 ? 

3. 将 一 个 金融 班 的 学 生 分 成 5 组 ， 每 一 个 组 完成 一 个 课题 ， 并 且 在 班 中 其 他 组 前 做 一 个 报 
告 ， 做 完 所 有 的 报告 以 后 ， 每 一 个 组 给 其 他 的 组 评分 ， 从 最 好 的 〈10 分 ) 到 最 差 的 (0 
分 ) 打分 . 这 里 是 他 们 的 评分 . 


被 评 组 
评分 组 1 2 3 4 5 
1 6.7 9.1 8.6 9.2 
2 7.6 9.0 8.1 9.3 
3 8.6 8.3 8.9 9.4 
4 8.9 8.5 8.8 9.6 
5 9.1 9.3 9.6 9.4 


每 一 个 组 得 到 的 评分 是 否 有 显著 区 别 ? 如 果 有 ， 哪 一 个 组 得 到 的 评分 显著 高 于 其 他 
的 组 ? 


思考 题 
l. 证 明 : kb=rt (提示 : 以 两 种 不 同方 法 计数 观测 值 数 ). 
2. WE: A=r(k-1)/(1-1) (ER: 首先 注意 任意 一 个 制定 的 处 理发 生 在 r 区 组 中 ， 然 后 


计算 那些 处 理 没有 出 现在 这 r 个 区 组 里 的 单元 数 ， 并 用 两 种 不 同 的 方法 计数 ). 


5.10 A.R.E. 不 低 于 1 的 检验 


本 节 所 描述 的 检验 具有 一 个 共同 的 性 质 ， 当 它们 与 通常 的 参数 检验 比较 时 ， 只 
要 参数 检验 是 合适 的 ， 它 们 的 A. R. E. 都 等 于 1， 如 果 参 数 检验 中 的 正 态 分 布 假设 不 
满足 ， 那 么 在 某 些 常 见 的 条 件 下 ，A. R. E， 往 往 大 于 1， 甚至 趋 近 于 正 无 穷 . 如 果 用 
渐 近 相对 效率 ( A. R. E. ) 来 衡量 检验 ， 则 本 节 中 的 检验 总 是 要 优 于 一 般 的 参数 检 
验 ， 如 1 检验 ,FF 检验 ， 这 个 结论 听 起 来 似乎 相当 强 ， 但 这 是 事实 . 记 住 ，A. R. E. 
只 是 许多 衡量 检验 方法 中 的 一 个 ， 尽 管 它 也 是 比较 检验 的 方法 中 最 被 广泛 接受 的 一 
个 .相对 效率 (无 渐 近 ) 也 是 一 个 比较 方法 ， 当 样本 容量 有 限时 ， 在 同等 条 件 下 ， 
它 比 较 两 个 检验 如 果 具 有 相同 的 功效 时 所 需要 的 样本 大 小 ， 根 据 相对 效率 ， 本 章 中 
的 检验 视 具体 情况 情况 可 能 优 于 或 劣 于 它们 的 参数 检验 情形 ， 由 于 我 们 很 难 考虑 到 
所 有 的 情况 ， 所 以 我 们 通常 使 用 A. R. E. 来 比较 检验 . 

与 本 章 前 面 几 节 不 同 ， 本 节 中 我 们 将 不 介绍 新 的 试验 情况 .我们 已 经 介绍 了 基 
于 秩 的 非 参数 方法 ， 以 便 解决 5. 2 节 的 单 向 表 ，5. 4 节 的 相关 性 ， 以 及 5.8 节 的 随机 
化 的 完全 区 组 设计 ， 这 些 方法 都 是 被 广泛 接受 的 ， 合 理 有 效 而 且 不 难 操作 ， 相 比较 
而 言 ， 本 节 中 的 方法 一 样 有 效 ， 只 是 操作 起 来 略 有 难度 . 本 节 中 的 假设 实际 上 等 同 
于 前 面 检验 的 基本 假设 .事实 上 , 它们 本 质 上 还 是 秩 检验 ， 只 是 略 有 修饰 使 得 它们 
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的 A. R. E， 更 好 . 使 用 者 可 以 自己 决定 是 否 用 这 些 和 前 面 介绍 的 检验 ， 没 有 严格 的 
统计 基础 说 明 一 定 要 使 用 某 种 检验 . 

我 们 介绍 的 第 一 种 检验 是 基于 van de Waerden( 1952 ,1953 ) 建议 的 一 个 简 
单 想法 . 即 在 所 有 计算 中 ， 用 另外 一 些 数据 替换 基本 数据 的 秩 ， 如 近似 服从 
正 态 分 布 的 数据 ， 特 别 地 ， 我 们 可 利用 标准 正 态 分 布 的 k/(N+1) 分 位 数 ， 其 
中 ,大 =1,2,…,N,N 代表 样本 容量 ， 这 些 分 位 数 有 时 称 作 正 态 得 分 ， 可 从 表 
Al 中 获得 .比如 ， 有 5 个 观测 值 的 随机 样本 ， 由 小 到 大 依次 为 7.3,7.7 ,9.2， 
12.0 和 26.4， 注 意 较 小 的 3 个 观测 值 差 别 不 大 ， 第 4 个 观测 值 较 前 3 个 明显 
偏 大 ， 而 最 大 的 观测 值 是 所 有 观测 值 的 至 少 2 Ë. 用 它们 的 秩 1,2,3,4,5 # 
代 它 们 的 观测 值 ， 也 就 是 把 非 对 称 的 原始 数据 转化 为 对 称 的 、 近 似 等 分 的 、 
像 “ 均 匀 分 布 ”的 数据 ， 在 本 章 的 前 几 节 中 ， 我 们 解释 了 对 原始 数据 通常 的 
同类 分 析 如 何 也 能 转化 成 对 于 秩 的 分 析 . 现在 ， 根 据 van der Waerden 的 建议 ， 
我 们 将 秩 转化 为 正 态 得 分 ， 即 用 由 表 Al 中 得 到 的 正 态 分 布 的 kA(N+1) 分 位 
数 取 代 秩 大 ， 因 此 秩 1 将 转化 为 zi = zo16or = -0.9661, 秩 2 将 转化 为 za = 
zo a3 = -0.4316， 依 此 类 推 ， 然后 我 们 不 再 分 析 这 些 秩 ， 而 是 分 析 得 到 的 正 
态 得 分 -0.9661, -0. 4316 ,0. 0000 ,0. 4316 和 0.9661. 一 般 来 说 ， 这 些 得 
分 以 零 为 中 心 对 称 分 布 ， 并 将 与 “完美 的 正 态 样本 ”具有 相似 的 散布 区 域 
(“完美 的 正 态 样本 ”当然 是 没有 的 ). 正 态 得 分 检验 是 一 个 非 参 数 检 验 ， 化 
的 渐 近 效率 与 总 体 是 正 态 分 布 前 提 下 的 参数 检验 相同 ; 而 在 总 体 是 非 正 态 分 
布 时 ， 它 有 较 大 的 渐 近 效率 . 

下 面 我 们 将 通过 分 析 显 示 ， 看 怎样 用 正 态 得 分 来 作为 5.2 节 中 检验 大 个 总 体 相同 
的 Kruskal-Wallis 检验 的 一 个 调整 ， 两 样本 问题 是 5. 1 节 中 的 有 关 Mann-Whitney 检验 
的 特殊 情形 . 


> 几 个 独立 样本 的 van der Waerden ( 正 态 得 分 ) 检验 


数据 ”数据 由 个 随机 样本 组 成 ， 每 一 个 样本 可 能 具有 不 等 的 样本 容量 .， 记 第 i 个 容 
BEN n, EZK: Xa Xaoo Xa 令 N 表 示 样 本 观测 总 数 。 如 Kruskal-Wallis 检验 所 
R, 给 N 个 观测 值 从 秩 1 到 秩 N 赋 秩 ， 当 存在 结 时 ， 使 用 平均 秩 ， 并 记 X; 的 秩 
为 R(X,). 
变换 每 个 秩 R 为 标准 正 态 分 布 的 RA(N+1) 分 位 数 ( 见 表 A). 为 了 简便 ， 称 这 
些 分 位 数 为 “ 正 态 得 分 ”， 记 作 A; 
R(X;) 


Aij = zrn = 从 表 Al1 得 到 的 第 六 二 T 个 分 位 数 (1) 


为 了 便于 得 到 正 态 得 分 ， 我 们 计算 出 R(X;)A(N+1) 后 只 保留 3 位 小 数 ， 然 后 通过 表 
Al 求 值 ， 则 大 个 样本 中 每 个 样本 的 平均 得 分 为 : 


方差 为 
S= 2a (3) 
得 分 


注意 ， 如 果 没 有 结 或 有 许多 结 ， 但 本 质 上 结 为 零 时 ， 则 总 体 均 值 等 于 零 ， 因此 在 计 
算 方差 时 ， 总 体 均 值 可 以 省 略 . 

BER REHBER Kruskal-Wallis 检验 的 假定 条 件 相 同 . 

检验 统计 量 ”检验 统计 量 T, 定义 为 


IŠ 一 ， 
Ti = =Z: > n (A;) (4) 


其 中 ,A 和 分别 如 (2), (3) 式 所 示 . 
零 分 布 正如 在 分 析 秩 R(X,) 的 所 有 置换 后 ， 得 到 Kruskal-Wallis 检验 统计 量 的 精确 
分 布 一 样 ，T, 的 精确 分 布 在 分 析 得 分 4, 的 所 有 置换 后 也 可 以 得 到 ， 但 是 ， 这 样 的 分 
析 在 许多 情况 下 是 很 困难 的 ， 所 以 我 们 经 常用 自由 度 为 -1 的 x 分 布 作为 逼近 分 
布 ， 而 这 样 的 逼近 通常 是 很 好 的 
假设 如同 Kruskal-Wallis 检验 一 样 ， 我 们 有 : 
Hu: 所 有 K 个 总 体 的 分 布 函数 相同 
Hi: 至 少 有 一 个 总 体 倾向 于 比 至 少 一 个 其 他 分 布 产生 较 大 的 观测 值 

如 果 通 过 查 表 A2 得 到 统计 量 T, 超过 分 布 (自由 度 为 k-1) 的 1-a 分 位 数 ， 
那么 以 水 平 a 拒绝 零 假设 ， 注 意 这 只 是 一 个 近似 ， 但 是 在 实际 应 用 中 ， 它 还 是 足够 
好 的 ， 我 们 还 可 以 通过 比较 T, 和 表 A2 中 的 分 位 数 得 到 己 - 值 
多 重 比较 ”如 果 拒绝 了 零 假设 ， 那 么 我 们 可 以 得 出 结论 ， 如 果 下 列 不 等 式 成 立 

D S NS y ny ; 
-D> (Si) (++ 1) 6) 

则 总 体 ;和 了 不 相同 ， 其 中 ，n -为 自由 度 为 Y -大 的 :分 布 的 1 - o/2 分 位 数 ， 它 可 
以 由 表 A21 得 到 ， 其 他 项 如 前 所 定义 ， 对 所 有 的 i 和 j 的 组 合 ， 这 个 方法 可 以 重复 进 
行 ， 在 多 重 比较 中 使 用 的 a 与 前 面 所 用 的 a 相同 . 
计算 机 辅助 ”StatXact 中 含有 正 态 得 分 检验 的 程序 ， 可 以 求 出 精确 的 p- 值 
例 5. 10.1 
再 来 考虑 5.2 节 中 用 于 说 明 Kruskal - Wallis 检验 的 例题 ， 在 此 我 们 还 将 用 到 4.3 节 
中 的 中 位 数 检验 来 进行 这 些 方法 的 比较 

下 表 列 出 了 用 4 种 不 同方 法 种 植 玉米 谷物 所 得 到 的 观测 值 和 它们 的 秩 


< 
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方法 1 方法 2 方法 3 方法 4 

观测 秩 正 态 得 分 观测 # 正 态 得 分 观测 秩 正 态 得 分 观测 # ESAT 
83 ë n -0.4845 91 23 044 101 3 185 78 2 -1.5805 
9 2 0.4043 90 195 — 01434 100 33 15805 8 9 -0.6526 
94 285 0.8927 81 65 -0.8927 9 23 04043 8 65 -0.8927 
89 17 -0.0351 83 11 -0.4845 93 2 07421 7 1 -1.8957 
89 17 -0.0351 84 13.5 -02898 9 315 12816 79 3 —1.3658 
9 315 1.2816 83 11 _0.4845 9 30 106 81 65 -0.8927 
9 23 0.4043 88 15 -0.1789 94 285 0827 8 4 ~1.2055 
9 2% 0.6526 91 23 0.4043 81 65 -0.8927 
90 195 0.1434 89 17 -00351 

84 13.5 -0.2898 
FH A: 0.3582 —0.1703 1.1234 ~1.1723 


用 下 面 的 方式 将 秩 转化 为 正 态 得 分 ， 总 样本 容量 为 N=34， 因 此 ， 用 每 一 个 秩 
除 以 N+1 =35， 结 果 保 留 到 3 位 小 数 . 例如 ， 第 一 个 观测 值 的 秩 为 11， 则 11735 等 
于 0.314， 查 表 A1， 我 们 得 到 0. 314 分 位 数 的 对 应 值 为 -0. 4845. 

每 一 种 种 植 方法 的 平均 得 分 如 上 表 所 示 . 由 (3) 式 计算 方差 ， 即 34 个 正 态 得 
分 的 平方 和 除 以 33 ， 结 果 是 S =0. 8447、 一 般 来 讲 ，5S” 总 是 略 小 于 1. 0， 我 们 得 到 
的 也 的 观测 值 为 25. 1840， 它 远 远大 于 由 表 A2 查 到 的 自由 度 为 k -1 =3 的 x 分 布 的 
0.95 分 位 数 ， 即 7.815 ， 因 此 ， 拒 绝 零 假设 ， 当 用 中 位 数 检验 〈 例 4.3.1， 其 中 统 
计量 T=17.6) 和 Kruskal-Wallis 检验 ( 例 5.2.1， 其 中 统计 量 T=25. 46) 时 ，p- 值 
小 于 0. 001. 

在 进行 多 重 比较 的 过 程 中 ， 我 们 应 用 自由 度 为 30( =34 -4) 的 上 分 布 的 0.975 


分 位 数 ， 由 表 A21 查 得 为 2.042， 计算 结果 如 下 . 

a `l e — A T š 

IA, — Ail tog7s (s ` ) (+ T z) 
i= 1,j=2 0.5286 0.4401 
i=1,j=3 0.7652 0.4828 
i=1,j=4 1.5305 0.4655 
i=2,j=3 1.2937 0.4721 
i=2,j=4 1.0020 0.4544 
i=3,j=4 2.2957 0.4958 


在 每 一 种 情况 下 ， 平 均 得 分 都 足够 大 ， 因 此 我 们 得 出 结论 : 任意 两 个 总 体 都 是 不 相 
同 的 ， 注意 ,在 5.2 节 中 ， 用 Kruskal-Wallis 检验 也 得 到 了 相同 的 结论 ， 这 两 种 检验 
的 结论 经 常 一 致 ， 但 并 不 总 是 一 致 、 为 了 避免 含糊 不 清 的 情况 出 现 ， 我们 通常 只 用 
两 种 检验 的 其 中 一 种 ， 而 不 同时 使 用 . "= 

现在 应 该 明确 的 是 ， 使 用 正 态 得 分 和 秩 的 方式 是 相同 的 : 用 数字 取代 原始 数据 . 
对 于 正 态 得 分 的 分 析 与 对 于 秩 的 分 析 是 相似 的 .我 们 可 以 给 出 精确 的 表 ， 但 是 我 们 
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在 此 并 不 给 出 ， 而 是 一 概 使 用 大 样本 通 近 方法 ,无论 实际 样本 是 大 还 是 小 . 
Van Eden( 1963 ) 提 到 了 一 样本 问题 的 van der Waerden 类 型 的 检验 ， 它 类 似 于 
Wilcoxon 符号 秩 检验 . J R, 表示 5.7 节 中 在 (5.7.3) 式 前 面 定 义 的 符号 秩 ， 如 果 


我 们 不 使 用 符号 秩 R,， 而 是 使 用 正 态 分 布 的 第 了 [1 + R/(n +1)] 分 位 数 ( 见 表 


Al), HE, n 是 数据 中 非 零 差异 数 ， 则 我 们 称 之 为 符号 正 态 得 分 ， 记 为 A,， 注 意 ， 
A, 与 R, 有 相同 的 符号 ， 因 此 我 们 可 以 用 检验 统计 量 


n 
> Ai 
i=1 


与 标准 正 态 分 布 的 分 位 数 相 比较 ， 得 到 Wilcoxon 符号 秩 检验 的 一 个 近似 检验 ， 两 个 
检验 具有 相同 的 假设 和 假定 条 件 ， 而 精确 的 p- 值 可 以 用 SratXact 求 得 . 
例 5. 10.2 
为 了 进行 比较 ,我 们 使 用 例 5.7. 1 中 的 数据 来 检验 
Ho: 双 胞 胎 中 先 出 生 的 一 个 不 比 后 出 生 的 更 具有 进取 性 
:双胞胎 中 先 出 生 的 一 个 比 后 出 生 的 更 具有 进取 性 


(6) 


T: = 


数据 如 下 : 
双胞胎 集 第 一 个 第 二 个 ŽD |Di 的 秩 AFAR 符号 正 态 得 分 Ai 
ih Æ X; H Y; 
1 86 88 +2 3 3 0.3186 
2 71 77 +6 7 7 0.8134 
3 77 76 al 1.5 "E —0.1560 
4 68 64 -4 4 -4 -0.4316 
5 91 96 +5 5.5 5.5 0.6098 
6 72 72 0 == = 
7 77 65 ey 10 -10 —1.3852 
8 91 90 = 1.5 -1.5 —0.1560 
9 70 65 -5 5.5 -5.5 —0.6098 
10 71 80 +9 9 9 1.1503 
11 88 81 = 8 >g -0.9661 
12 87 72 -15 11 sii —1.7279 
由 于 (6) 式 定 义 的 检验 统计 量 T, 等 于 
$A; 
i=] 一 2.5405 
T = -二 -一 = — = -0.8514 
` jz ， V89027 和 
2, Aí 
i=1 
它 对 应 于 单 边 p- 值 为 0. 197 ( 见 表 Al ) ， 这 与 Wilcoxon 符号 秩 检验 的 结论 一 致 ， 因 
为 Wilcoxon 符号 秩 检验 的 T= —0.7565, p-fË =0. 238. m 


Klotz(1962) 介 绍 了 应 用 正 态 得 分 进行 两 个 样本 的 等 方差 检验 ， 这 个 检验 开始 时 
像 两 样本 的 van der Waerden 检验 ， 但是， 后 面 在 统计 量 
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i=] 
T m a, a ATM (8) 
Ea = [Za - P a?) J 
中 所 应 用 的 是 正 态 得 分 的 平方 而 不 是 正 态 得 分 ， 其 中 4, 表示 正 态 得 分 ， 样 本 容量 分 
别 为 m 和 nn，N=m+n 则 表示 联合 样本 容量 ， 将 7 与 表 Al 中 的 正 态 分 布 分 位 数 进 
行 比较 .如 果 两 组 样本 来 自 于 均值 不 同 的 两 个 总 体 ， 则 我 们 在 最 初 赋 秩 之 前 ， 首 先 
应 该 分 别 减 去 它们 各 自 的 均值 ( 如果 已 知 ) 或 样本 均值 ， 在 StarXact 中 可 以 编程 计 
算 Klotz 检验 的 精确 p- 值 . 
例 5. 10.3 
考虑 例 5. 3. 1， 我 们 将 分 析 该 例 的 细节 ， 并 与 平方 秩 检验 进行 比较 ， 检 测 一 台新 机 
器 看 是 否 比 现 有 的 机 器 更 加 稳定 ， 则 检验 的 零 假设 为 : 
Ho: 新 机 器 和 现 有 机 器 的 变化 量 相同 
其 单 边 备 择 检验 为 : 
Hi: 新 机 器 有 更 小 的 方差 
由 于 不 知道 总 体 均值 ， 所 以 首先 用 数据 减 去 其 样本 均值 来 调整 数据 ， 即 产生 一 个 类 
似 于 平方 秩 检验 的 近似 检验 . 


Ri 

X X-X # N+1 ESATA A? 
10.8 .06 8 .615 0.2924 .0855 
iii .36 11 .846 1.0194 1.0392 
10.4 -34 2 .154 -1.0194 1.0392 
10.1 —.64 1 .077 —14255 2.0321 
11.3 .56 12 .923 1.4255 2.0321 

Y, Y, — Y 

10.8 .01 6 .462 一 0.0954 .0091 
10.5 一 .29 3 .231 一 0.7356 .5411 
11.0 .21 10 .769 0.7356 .5411 
10.9 .11 9 .692 0.5015 .2515 
10.8 .01 6 .462 —0.0954 .0091 
10.7 —.09 4 .308 —0.5015 .2515 
10.8 .01 f 462 —0.0954 .0091 


在 Kloz 检验 中 ,一 个 基本 的 衡量 变化 量 的 量 是 所 有 4; 的 和 ， 从 第 一 个 样本 
(从 现 有 的 机 器 ) 开始 计算 ， 为 了 检查 它 的 显著 性 水 平 ， 我 们 先 减 去 它 的 均值 ， 然 


后 除 以 它 的 标准 差 ， 在 零 假 设 的 条 件 下 ， 得 到 
T, = 6:2280 — 3.2669 
A 1.2629 


( 见 (8) R), 3# T, 5R A 中 的 数值 进行 比较 , 我们 得 到 单 边 p- 值 约 为 0.01,， 与 
平方 秩 检 验 得 到 的 结论 相似 . m 


= 2.3447 (9) 


[403] 
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为 了 将 正 态 得 分 的 概念 用 于 回归 和 相关 性 分 析 中 ， 首 先 用 正 态 得 分 代替 X, 的 秩 ， 
然后 同样 用 正 态 得 分 代替 Y, 的 秩 ， 如 果 没 有 出 现 结 ，X 变量 和 Y 变量 的 正 态 得 分 集 
合 应 该 相同 ， 就 像 对 每 一 个 变量 应 用 相同 的 秩 1 到 秩 n 的 集合 ， 应 用 正 态 得 分 计算 
Pearson 乘积 和 矩 相 关系 数 (L (5.4.2) R). 如果 没有 结 ， 因 为 平均 得 分 等 于 零 ， 则 
相关 系数 可 以 化 简 为 


n 
> A;B; 


i 


= (10) 
> A 


i=] 

(A, #ll B, 分 别 为 赋 给 X, 和 Y, 的 正 态 得 分 ). (10) 式 有 时 也 可 以 用 于 存在 结 的 情况 ， 
除非 当 结 很 多 时 ， 此 时 最 安全 的 方法 是 转 而 应 用 (5.4.2) 式 和 实际 所 用 的 正 态 得 
分 .5.4 节 或 5.6 节 中 描述 的 方法 可 能 用 来 处 理 这 样 的 得 分 ， 不 过 我 们 在 此 不 做 详细 
讨论 . 

对 于 双向 表 ， 回 忆 5. 8 节 中 的 Friedman 检验 ， 在 每 一 个 区 组 中 对 观测 值 赋 秩 . 
这 里 我 们 以 通常 的 方式 用 正 态 得 分 代替 这 些 秩 ， 令 4, 记 为 赋 给 区 组 i 中 对 应 于 处 理 j 
的 变量 X 的 正 态 得 分 ，4, 记 为 对 应 于 处 理 j 的 正 态 得 分 和 ， 类 似 于 Friedman 检验 中 
的 R(X;) 和 R,。， 此 时 ,检验 统计 量 为 


p = 


k—-1/ < 
T= (24?) a1) 
g= 
其 中 ， 
S= > Af (12) 
所 有 
得 分 


将 统计 量 和 自由 度 为 上 -1 的 分 布 的 分 位 数 相 比较 (LR A2), ， 过 程 与 Friedman 检 
验 中 的 统计 量 T, (A (5) 式 ) 相仿 ， 其 他 的 细节 也 与 讨论 Friedman 检验 相同 ， 只 
不 过 对 于 这 个 新 的 检验 来 说 , x 分 布 的 近似 程度 已 经 非常 好 了 ， 因 此 也 就 无 须 使 用 F 
分 布 ， 多 重 比较 的 分 析 与 5.8 节 中 所 描述 的 分 析 相 同 ， 只 不 过 在 此 我 们 用 TA S 代 
替 了 (5.8.8) 式 中 的 T AA -Ci 

到 目前 为 止 ， 如 何 应 用 正 态 得 分 代替 秩 的 方法 应 该 比较 清楚 了 ， 相 对 于 参数 检 
验 ， 结 果 是 正 态 得 分 检验 有 略 高 的 A. R. E. .相对 于 前 面 几 节 中 介绍 的 秩 检验 ， 视 具 
体 情况 而 定 ， 它 的 A.R. E. 可 能 大 于 1 或 小 于 1， 某 些 其 他 的 得 分 检验 也 可 以 取代 正 
态 得 分 ， 并 可 得 到 与 正 态 得 分 检验 相同 的 A.R. E. ， 其 中 两 种 类 型 的 得 分 称 为 “随机 
正 态 离 差 ”或 “期 望 正 态 得 分 ”". 我 们 下 面 对 它 们 进行 简单 的 介绍 . 


随机 正 态 离 差 


对 于 来 自 于 任 一 分 布 的 随机 样本 X, ,…,X,， 我 们 用 一 组 看 似 来 自 正 态 分 布 的 数 
来 代替 它 ， 具 体 方法 是 得 到 一 组 a 个 看 似 产 生 于 正 态 分 布 的 数据 ， 然 后 用 最 小 的 数 
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据 蔡 换 原始 数据 中 最 小 的 一 个 ， 用 第 二 小 的 数据 替换 原始 数据 中 第 二 小 的 一 个 ， 依 
此 类 推 ， 因 此 用 伪 正 态 随机 数 中 赋 秩 上 的 数 代替 原始 观测 值 中 赋 秩 大 的 观测 ， 注 意 在 
这 个 检验 中 我 们 只 需要 知道 原始 观测 值 的 秩 ， 就 可 以 完成 这 种 替代 . 因此 这 是 一 个 
秩 检验 的 统计 过 程 。 伪 随机 样本 可 以 从 有 关 随 机 数 表 上 获取 ， 如 一 本 名 为 A Million 
Random Digits with 100 ,000 Normal Deviates( Rand Corporation , 1955 ) 的 书 上 就 有 这 样 
HR, 或 者 设计 具体 的 计算 机 程序 生成 ， 这样 的 数据 叫做 “随机 正 态 离 差 ， 尽 管 它 
们 并 不 是 真正 意义 上 的 随机 ， 它 们 只 是 经 过 谨慎 考虑 产生 的 似乎 服从 于 标准 正 态 分 
布 的 近似 随机 样本 . 

例如 ， 我 们 先前 使 用 的 正 态 得 分 的 数据 为 ，7.3,7.7,9.2,12.0,26.4， 我 们 由 表 
中 获取 一 组 5 个 正 态 离 差 为 0.026, - 1.388 ,2. 388 ,1.066, -0.173 ， 用 它们 中 最 小 
的 值 - 1.388 替代 7.3， 次 小 的 值 -0. 173 替代 7.7， 等 等 ， 从 这 点 上 来 看 ， 这 些 新 数 
据 的 使 用 与 正 态 得 分 和 秩 的 应 用 很 相似 ， 当 然 ， 有 的 人 在 分 析 相 同 的 数据 时 可 能 使 
用 不 同 的 5 个 数 ， 这 就 会 导致 分 析 的 结论 略 有 不 同 《有 时 甚至 有 较 大 的 区 别 )， 最 粮 
糕 的 情况 是 两 个 人 用 同一 种 分 析 同 一 种 数据 得 到 矛盾 的 结论 . 正 是 内 为 这 个 原因 ， 
在 现实 的 分 析 过 程 中 很 少 用 这 样 的 分 析 ， 但 是 由 于 它 的 A.R. E 与 正 态 得 分 的 检验 
相同 ， 而 且 它 的 精确 分 布 与 参数 检验 相同 ， 所 以 人 们 从 理论 的 观点 对 于 研究 它 很 感 
兴趣 . | 

Bell 和 Doksum( 1965 ) 详细 地 阐述 了 关于 随机 正 态 离 差 的 原则 ， 而 早先 的 分 析出 
现在 Durbin( 1961 ) ,Fraser(1957) 以 及 Ehrenberg( 1951 ) 的 文章 中 . 


期 望 正 态 得 分 


一 种 看 待 正 态 离 差 方 法 的 观点 是 ， 认 为 用 服从 正 态 分 布 的 次 序 统计 量 Z” 来 代替 
实际 的 次 序 统计 量 X2， 下 面 我 们 所 考虑 的 得 分 ， 即 用 ZO 的 均值 E(Z”) 代 替 次 序 统 
计量 本 身 . 这 些 期 望 正 态 得 分 是 已 经 定义 好 的 数 ， 在 一 些 表 中 可 以 查 到 ， 如 Fisher 和 
Yates( 1957 ) ,Pearson 和 Hartley( 1962) 以 及 Owen( 1962). 因此 在 用 E(Z® ) 代 替 Z 
(如 随机 正 态 离 差 ) 时 ， 由 ZO 的 变异 性 引起 的 麻烦 即 被 消除 .这 一 类 方法 也 只 依赖 
于 观测 值 的 秩 ， 因 此 也 是 一 个 秩 检验 .Fisher 和 Yates (1957) 建议 用 这 些 精 确 的 得 
分 代替 原始 数据 ， 然 后 对 这 些 期 望 正 态 得 分 数据 应 用 参数 方法 ， 从 而 得 到 一 个 非 参 
数 方法 ， 这 些 方 法 的 A. R. E. 与 正 态 得 分 方法 以 及 随机 正 态 离 差 方法 相同 . Bradley 
(1968) 对 于 这 种 变化 给 出 了 一 个 较为 复杂 的 表达 . 
口 理论 ”我们 这 里 使 用 前 几 节 中 寻找 检验 统计 量 精确 分 布 的 方法 ， 只 不 过 有 些 细微 
的 修改 ， 其 一 就 是 我 们 不 使 用 秩 1,2,3,…， 取 而 代 之 的 是 一 些 数 ， 记 它们 为 : a(1)， 
a(2) ,a(3),…, 其 中 ，a(i) 表 示 正 态 得 分 ,期望 正 态 得 分 或 者 由 独立 于 数据 所 获取 的 
其 他 任 一 数 集 ， 其 二 是 所 得 的 新 数据 有 着 与 秩 不 同 的 均值 和 方差 .我 们 需要 确定 这 
些 均值 和 方差 . 

我 们 用 下 面 的 例子 来 说 明 寻 找 精确 分 布 的 方法 ， 如 在 Mann-Whiteny 检验 中 ， 给 
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定 两 个 独立 样本 尺 ,X,,…,XX, 和 Y,，Y,,…，Y,， 样 本 容量 分 别 为 n 和 m. 在 分 布 相 
同 的 零 假 设 成 立时 ， 赋 给 变量 大 的 秩 是 它 在 1 到 n+m 中 等 可 能 取 到 的 任 一 个 ， 因 此 
X, 的 任 一 得 分 在 a(1) ,a(2),a(3),…,a(m+n) 中 也 是 等 可 能 的 .依次 可 以 类 推 至 


m+n 


XXe 以 及 Y , Y, , Y, 等 等 ， 因 此 ， 可 以 看 出 给 X 赋 个 秩 ， 共有 | k 


n 
能 的 赋 秩 方式 ， 而 每 种 方式 都 是 等 概率 的 ， mee | gia. 这 也 意味 着 在 a(1) 
Hn 
#ja(m+n)th, XXR n MRA, 共有 | )wamowayx, 每 一 种 方式 出 
n 


m+n 
现 的 概率 为 : 1| ) 这 使 得 基于 赋 给 X( 或 Y) 的 得 分 或 秩 的 统计 量 的 零 分 布 可 
n 


以 用 前 面 所 述 的 计数 方法 来 求 得 . 
具体 地 ， 令 n=2,m=3， 我 们 所 用 的 得 分 为 正 态 得 分 ， 
a(1) = —0.9661 
a(2) = —0.4316 
a(3)= 0.0000 
a(4) = 0.4316 
a(5) = 0.9661 
则 对 X ,X, ， 它 们 可 能 的 秩 、 相 应 的 得 分 以 及 得 分 和 ， 如 下 表 . 
(R(X),R(X,)) 得 分 (Ai A,) 和 概率 
(1, 2) (一 0.9661,， —0.4316) 一 1.3977 0.1 
(1, 3) (—0.9661, 0.0000) —0.9661 0.1 
(1, 4) (—0.9661, 0.4316) —0.5345 0.1 
(1, 5) (—0.9661, 0.9661) 0.0000 0.1 
(2, 3) (一 0.4316, 0.0000) —0.4316 0.1 
(2, 4) (—0.4316, 0.4316) 0.0000 0.1 
(2, 5) (一 0.4316, 0.9661) 0.5345 0.1 
(3, 4) (0.0000, 0.4316) 0.4316 0.1 
(3, 5) (0.0000, 0.9661) 0.9661 0.1 
(4, 5) (0.4316, 0.9661) 1.3977 0.1 


因此 我 们 可 以 求 出 得 分 和 的 分 布 函数 类似 地 ， 我 们 可 求 出 本 节 所 涉及 的 任 一 
统计 量 的 分 布 函 数 ， 但 是 我 们 不 打算 列 出 精确 分 布 的 表格 ,而 是 使 用 它们 的 渐 近 
分 布 . 口 

在 两 样本 的 情况 下 ,为 了 找到 秩 和 的 均值 和 方差 ， 我们 可 以 使 用 5.3 节 中 提 到 
的 方法 ， 该 节 中 得 到 的 结论 可 以 直接 用 于 本 节 的 情况 , 用 (5.3.18) 式 求 均 值 ， 
(5.3.24) 式 求 方差 .使 用 得 分 代替 秩 的 情况 更 加 复杂 ，Hajek 和 Sidak ( 1967 ) 对 此 问 
题 进 行 了 详细 的 讨论 ， 同 时 描述 了 如 何 选取 特殊 情况 下 的 最 佳 得 分 ， 并 提供 了 一 套 


5.11 Fisher 随机 化 方法 299 


完整 的 理论 ， 尽 管 这 一 理论 已 经 超出 了 本 书 的 范围 ， 但 是 Hajek 和 Sidak 的 书 是 值得 
一 读 的 ， 并 推荐 给 大 家 . 

关于 随机 正 态 数 的 讨论 ， 我 们 可 以 参考 Marsaglia( 1968 ) 或 者 Lewis(1975 ) ， 这 
也 是 众多 有 关 这 方面 参考 书 中 的 两 本 .Jogdeo( 1966 ) 证 明了 对 于 某 些 确定 的 备 择 假 
设 ， 随 机 正 态 离 差 的 相对 效率 小 于 1. Ramsey(1971 ) 考查 了 基于 两 样本 检验 的 小 样 
本 功效 ， 而 Raghavachari ( 1965b ) , Thompson , Govindarajulu , Doksum ( 1967 ) , Bhatta- 
charyya( 1967 ) ,Stone( 1968 ) 以 及 Gokhale (1968) 考虑 了 检验 的 大 样本 效率 Bradley ， 
Patel 和 Wackerly(1971) 在 多 元 情况 下 讨论 了 这 些 检 验 的 一 些 变化 ; Johnson 和 Mehro- 
tra( 1972) 对 删 失 数据 讨论 了 这 些 检验 的 一 些 变 化 ; Pirie 和 Hollander( 1972 ) 讨论 了 在 
随机 区 组 设计 中 有 序 备 择 假设 下 的 这 些 检验 的 变化 问题 ， 有 关 这 些 方法 的 多 角度 分 析 
可 以 参考 Lehmann(1975 ) 或 者 Hogg(1976 ) 


习题 


l. 在 习题 5. 2. 1 中 用 正 态 得 分 代替 秩 ， 并 比较 两 种 方法 所 得 的 结果 . 

2. 在 习题 5. 2. 3 中 用 正 态 得 分 代替 秩 ， 并 比较 两 种 方法 所 得 的 结果 . 

3. 在 习题 $.7. 1 中 用 正 态 得 分 代替 秩 ， 并 比较 两 种 方法 所 得 的 结果 . 

4. 在 习题 9. 7. 3 中 用 正 态 得 分 代替 秩 ， 并 比较 两 种 方法 所 得 的 结果 . 

5. 在 习题 5.3.1 中 使 用 Klotz 检验 对 数据 进行 分 析 ， 并 比较 两 种 方法 所 得 的 结果 . 

6. 在 习题 5.3.2 中 使 用 Klotz 检验 对 数据 进行 分 析 . 

7. 在 习题 5.4. 1 中 运用 正 态 得 分 计算 相关 系数 (根据 (10) =). 如 何 比较 这 个 系数 和 
Spearman 及 Kendall 系数 的 大 小 ”比较 pyn -1 和 由 表 Al 所 得 的 分 位 数 ， 对 独立 性 假设 进 
行 显著 性 检验 .比较 这 一 结果 与 习题 5. 4. 1 的 结果 ， 

8. 在 习题 5.4. 3 中 运用 正 态 得 分 进行 趋势 性 检验 .比较 pv -1 和 由 表 Al 所 得 的 分 位 数 进 
行 显著 性 检验 ， 并 比较 这 一 结果 与 习题 5. 4. 3 的 结果 . 

思考 题 

l. 对 n=5, 求 由 (6) 式 定义 的 统计 量 的 精确 分 布 . 

2. 对 n=2,m=3，, 求 由 (8) 式 定义 的 Klotz 统计 量 的 精确 分 布 . 

3. ”用 随机 数 表 或 产生 正 态 随机 数 的 计算 机 程序 获得 34 个 随机 正 态 离 差 ， 将 它们 从 小 到 大 排 


序 后 代替 例 5. 10. 1 中 的 正 态 得 分 ， 如 何 比 较 Bell-Doksum 方法 的 结果 与 van der Waerden 
及 Kruskal-Wallis 检验 的 结果 ? 


5.11 Fisher 随机 化 方法 


在 前 面 的 几 节 中 ， 我们 介绍 了 一 些 获 得 非 参 数 检验 的 方法 ， 每 一 种 方法 都 用 一 
个 得 分 集合 a(1) 到 a(CN) 代 替 秩 1 到 N 常用 的 得 分 包括 标准 正 态 分 布 的 分 位 数 ， 或 
是 一 些 产生 于 伪 正 态 分 布 的 随机 样本 ， 或 者 来 自 于 标准 正 态 分 布 次 序 统计 量 的 期 望 . 


心 


+ 
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我 们 已 经 提 到 过 任何 数 都 可 以 作为 得 分 ， 但 是 有 些 类 型 的 数 作为 得 分 ， 对 于 某 些 特 
定 的 备 择 假设 会 产生 更 高 的 功效 . 

假定 我 们 要 寻找 到 一 组 “ 较 好 ”的 得 分 代替 秩 1 到 NN， 并 决定 使 用 样本 中 
实际 的 数据 ， 这 些 数据 很 方便 使 用 ， 因 为 它们 正好 有 NN 个 ， 而且 容易 获取 . 如 
同 前 几 节 中 我 们 使 用 的 正 态 得 分 一 样 ， 我们 用 这 些 数 作为 得 分 来 进行 非 参 数 检 
验 ， 但 是 选择 这 个 得 分 是 否 比 选择 正 态 得 分 有 更 高 的 功效 呢 ? 根据 Lehmann 和 
Stein( 1949 ) , Hoeffding( 1952) 以 及 其 他 人 的 研究 显然 是 这 样 的 ， 他 们 还 发 现在 
某 些 情况 下 ， 这 些 方法 的 A. R. E. 与 最 有 功效 的 参数 检验 相 比 是 1.0. 因此 在 这 
种 情况 下 ， 这 些 得 分 不 仅 比 正 态 得 分 ， 也 比 其 他 一 些 检验 更 受 欢 迎 ， 为 什么 呢 ? 
如 果 是 这 样 的 话 ， 在 假设 检验 中 为 什么 我 们 不 用 数据 直接 代替 得 分 呢 ? 

但 是 ， 这 个 方法 的 最 主要 的 缺点 在 于 ， 它 使 得 检验 的 操作 变 得 宛 长 ， 由 于 对 
每 一 个 检验 这 些 得 分 都 是 不 同 的 ， 所 以 不 可 能 构造 临界 域 的 表 或 者 是 检验 统计 量 
零 分 布 的 分 位 数 ， 因 此 每 一 次 我 们 使 用 这 种 检验 ， 就 需要 根据 观测 到 的 数据 具体 
确定 临界 域 . 每 一 个 不 同 的 样本 就 意味 着 不 同 的 得 分 集合 以 及 不 同 的 临界 域 . 即 
使 在 条 件 容 易 满足 ， 检 验 统计 量 的 渐 近 分 布 为 一 个 标准 分 布 ， 如 正 态 分 布 或 x 分 
布 的 情况 下 ， 用 这 种 渐 近 分 布 作 为 近似 分 布 对 于 某 些 得 分 来 说 也 不 一 定 是 准确 
的 ， 当 得 分 是 秩 ， 正 态 得 分 或 者 期 望 正 态 得 分 时 ， 我 们 至 少 知道 得 分 是 什么 ， 
也 知道 近似 分 布 的 精确 性 ， 并 且 在 那些 情况 下 ， 渐 近 分 布 可 以 作为 很 好 的 近似 . 
但 是 当 得 分 集合 随 着 样本 而 变化 时 ， 这 就 很 难 确定 渐 近 分 布 近似 的 精确 性 了 . 
因此 简 而 言 之 ， 我 们 也 许 经 过 努力 得 到 精确 的 p- 值 ( 当 样 本 量 不 小 时 需要 相当 
大 的 努力 ) .寻找 近似 p- 值 的 方法 是 有 的 ,但 是 并 不 一 定 精 确 ， 由 于 用 StatXact 
可 以 求 得 精确 的 p- 值 ， 这 也 就 从 本 质 上 去 除了 这 个 不 利 影响 

第 二 个 缺点 是 对 本 节 中 的 随机 化 检验 ， 它 们 缺少 相对 功效 ，R. L. Iman 和 本 书 作 
者 未 发 表 的 模拟 研究 表明 ， 对 于 很 多 分 布 ，Fisher 随机 化 检验 的 功效 介 于 秩 检验 和 参 
数 检验 之 间 ， 总 的 来 说 ， 对 于 非 正 态 的 重 尾 分 布 或 那些 存在 奇异 值 的 数据 ， 一 个 通 
常 的 秩 检验 ， 如 Kruskal-Wallis 检验 倾向 于 比 Fisher 随机 化 检验 更 有 功效 . 

一 些 学 派 考虑 所 研究 的 样本 实际 上 不 是 来 自 于 假设 总 体 中 的 随机 样本 ， 而 是 总 
体 自身 ， 此 时 测量 集合 就 是 我 们 感 兴 趣 的 总 体 ， 本 节 中 讨论 的 随机 化 检验 能 够 而 且 
应 当 决 定 集 合子 群 影响 的 存在 与 否 . 更 完整 的 哲理 性 表达 参见 Kempthorne 和 Doerfler 
(1969). 

用 数据 本 身 作 为 得 分 的 想法 是 由 Fisher (1935) 引出 的 ， 结 果 检 验 就 是 传统 的 随 
机 化 检验 ， 尽 管 我 们 的 表达 可 能 使 人 们 认为 随机 化 检验 是 第 3 代 的 非 参数 检验 ， 排 
在 秩 检验 和 其 他 得 分 检验 之 后 ， 其 实 随机 化 检验 在 时 间 上 是 早 于 其 他 检验 的 ， 随 机 
化 检验 可 以 用 于 我 们 描述 过 的 任何 一 个 秩 检验 可 以 用 到 的 地 方 .我们 将 详细 地 给 出 
两 个 独立 样本 及 其 配对 样本 的 随机 化 检验 方法 ， 并 给 出 相应 的 例子 ， 以 便 说 明 如 何 
使 用 这 些 检验 ， 首 先 一 个 检验 就 与 5. 1 节 中 的 Mann-Whitney 检验 相似 . 
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> 两 个 独立 样本 的 随机 化 检验 


数据 ”由 两 个 样本 容量 分 别 为 n 和 mm 的 随机 样本 ,X,,…,X, M Y, Yast Yn 组 成 . 
假定 条 件 

1. 两 个 样本 是 来 自 于 它们 各 自 总 体 分 布 的 随机 样本 . 

2. 除了 每 个 样本 中 的 各 个 变量 相互 独立 外 ， 两 个 样本 之 间 也 是 相互 独立 的 . 

3. 度量 尺度 至 少 是 区 间 的 . 
检验 统计 量 ”检验 统计 量 T, 是 和 观测 值 的 和 


T = > X, (1) 


零 分 布 将 X 和 YY 混 合成 一 个 数据 集合 ， 从 中 抽取 出 个 数 ， 在 零 假设 成 立 的 前 提 
下 ， 每 一 种 n 个 数 的 组 合 方式 都 是 等 概率 的 ， 考 虑 所 有 组 合 的 可 能 性 即 得 到 和 零 分 布 . 
因为 不 同 的 实际 情况 得 到 的 X 和 Y 是 不 同 的 ， 因 此 无 法 构造 数学 表 ， 也 很 难 确定 相 


应 的 近似 分 布 . 

假设 ”我 们 只 分 析 双 边 检 验 ， 单 边 检验 与 5. 1 节 中 提 到 的 Mann-Whitney 检验 很 相似 . 
Ho: E(X) = E(Y) 
Hı: E(X) # E(Y) 


如 果 统 计量 T, >w, T BE T, <wa, MWAKE a 拒绝 为， 其 中 分 位 数 z 用 如 下 方 
法 求 得 

将 观测 到 的 X, 和 Y 值 视 为 一 个 含有 m+n 个 数 的 数组 ， 并 从 中 取出 n 个 样本 ， 
m+n 


共有 | 
n 
次 序 和 ， 即 7, ， 其 中 最 大 的 7 就 是 w, 


m+n 
| 种 可 能 的 选择 情况 为 了 找到 六 分 位 数 四 ， 考虑 | (p) 个 最 小 的 
Hç 


m+n 


如 上 上 述 ， 如果 | J 不是 一 个 整数 就 取 大 于 它 的 第 一 个 整数 如果 


n 
m+n m+n 
| 8 +e. w, 就 是 最 大 的 的 平均 ， 而 T, 是 从 所 考虑 的 | jo yi 
n n 


种 选择 中 得 到 的 . 
通过 计算 ， 从 严 + 于 个 数 中 选取 壮 个 数 使 它们 的 和 小 于 〈 或 是 大 于 ， 如 果 观 测 的 
T, 处 在 右边 ) 或 等 于 所 求 得 的 也 方式 的 个 数 ， 即 可 得 到 p- 值 ， 因 为 这 是 一 个 双边 检 


m+n 
验 ， 所 以 我 们 用 刚刚 计算 出 的 数值 乘 以 2， 然后 需要 除 以 | |: 即 是 p- 值 . 
H 


计算 机 辅助 ”如 果 样 本 的 容量 不 大 ， 我 们 可 以 考虑 所 有 可 能 出 现 的 置换 情况 ， 然 后 
通过 StatXact 求 得 该 检验 或 其 他 检验 的 p- 值 ， 对 于 置换 总 数 太 大 的 人 情况， 可 以 通过 随 
机 选取 其 中 足够 多 的 置换 来 估计 yp- 值 ， ————  — 4 
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例 5.11. 1 
假设 随机 样本 X, 分 别 为 0,1,1,0, -2; 随机 样本 Y, 分 别 为 6,7,7,4, -3,9 和 14. 
FERN: 
Ho: E(X) = E(Y) 
相应 的 备 择 假设 : 
Hı: E(X) # EY) 


对 两 个 独立 样本 进行 随机 化 假设 检验 ，a =0. 05. 
一 个 样本 容量 为 5， 另 一 个 为 7， 所 以 从 总 共 12 个 数 中 选取 5 个 数 的 方式 共有 


z 
[3] =™ 种 ， 因 为 (792) (0.025) =19.8， 所 以 我 们 需要 找到 20 组 T, 的 次 序 最 
小 值 ， 从 而 求 出 woos 这些 数 的 组 合 以 及 相应 的 T, 值 如 下 . 


联合 观测 

观测 的 T, 

# -3 2 0 0 1 1 4 6 7 7 9 14 (T =>X 
1 X X X X KYY YYYY Y Y -4 
2 X J X X S O YYYY N y -4 
3 X A =3 
4 X `x w x X K N Y N NM YO Y -3 
5 x IXIA Y S: XYY ly sy Y -1 
6 YY -1 
7 y YY YY Y 0 
8 X WY 3: WV 0 
9 X C X. s Oy OX KO Y yY YY yY sy 0 
10 X. ` YAX X. YYY yY Y 0 
11 和 0 
12 XY 1 
13 X 3 3 E V YY 1 
14 XO O X X Yy C oy. O K. O S oy x 2 
15 X K K N S O V S YYYY Y 2 
16 x XY 2 
17 X K y K N 3 Y X. Y Yy F 2 
18 YEA 3 OC OU OR OU 35 y 2 
19 x VY XX | Y < X X y N NV y 2 
20 K XY Y 2 


由 此 得 到 最 大 的 也 是 


z00025 = 2 


尽管 这 是 一 个 双边 检验 ， 但 是 没有 必要 求 zzuws ， 因 为 此 时 观测 到 的 卫 已 经 处 于 左 
边 范围 . 因为 由 数据 得 到 T, 的 观测 为 : 


Š 
T=% X. =0+1+1+0-2=0 
i=1 
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它 小 于 oa s =2， 所 以 拒绝 H。， 事 实 上 ， 可 以 在 水 平 为 


t 2(11) _ 
p- Ë 99 0.028 


拒绝 H,, EPA 11 种 可 能 的 排列 方法 使 得 得 到 的 值 小 于 或 等 于 0. Bi 


我 们 前 面 介 绍 的 随机 化 检验 是 一 个 很 典型 的 一 般 随 机 化 检验 方法 ， 如 果 不 使 用 
T, ， 我 们 也 可 以 应 用 两 样本 的 上 统计 量 对 20 种 组 合 分 别 计 算 分 布 的 两 个 尾部 概率 ， 
就 像 我 们 在 该 例题 中 所 操作 的 一 样 . 但 是 这 实际 上 是 不 需要 的 ， 因 为 正如 5. 1 节 中 提 
到 的 一 样 ，! 统计 量 是 T 的 一 个 单调 函数 ， 所 以 得 到 最 大 也 的 这 20 种 组 合 与 得 到 最 
大 1 的 组 合 相 同 . 我们 之 所 以 提出 这 一 点 ， 是 为 了 使 随机 化 检验 能 推广 到 如 单 向 表 、 
双向 表 、 相 关 性 检验 等 情形 ， 变 得 更 加 明显 ， 我们 常常 用 一 个 统计 量 或 者 比较 容易 
计算 这 个 统计 量 的 单调 函数 来 决定 数据 的 极端 排列 情况 ， 及 其 所 用 统计 量 的 临界 域 . 
由 于 在 计算 过 程 中 往往 存在 着 一 些 困 难 ， 所 以 有 时 我 们 不 求 临界 域 ， 只 求 p- 值 ， 特 
别 是 对 于 那些 p- 值 接近 于 零 ， 且 只 需要 考虑 数据 少数 排列 的 情况 . 

对 于 配对 的 随机 化 检验 与 一 般 的 随机 化 检验 略 有 不 同 ， 下 面 我 们 将 具体 加 以 说 
HH. 这 种 检验 与 5.7 节 中 的 Wilcoxon 符号 秩 检验 相仿 . 


> 配对 的 随机 化 检验 


数据 ”数据 由 n' 个 二 维 随机 变量 (X,Y ),(X,,Y,),…, (Xr Yr) AR, RE (X, 
Y) 相等 的 组 合 即 X - Y, =0 的 项 ， 记 莘 余 组 合 的 个 数 为 n， 并 记 非 零 差 X, -YX 
D, ,D,,*…,D,. 
假定 条 件 
1. 每 一 个 D, 的 分 布 是 对 称 的 . 
2. D, 是 相互 独立 的 . 
3. D, 有 相同 的 均值 . 
4. D, 的 度量 尺度 至 少 是 区 间 的 . 
检验 统计 量 ”检验 统计 量 T, 为 所 有 正 差 的 和 
T=XZD 其 中 求 和 仅 对 D;> 0 的 项 (2) 
零 分 布 ”通过 计算 出 D, 的 正 负 号 所 有 可 能 的 排列 ， 可 以 得 到 TT, 的 零 分 布 ， 在 零 假设 
下 ， 每 一 种 正 负 号 的 排列 都 是 等 可 能 的 .因为 T, 的 值 依赖 于 D KE, BIT, 随 着 观测 值 
的 变化 而 变化 ， 因 此 我 们 不 可 能 构造 分 位 数 表 ， 或 是 确定 可 能 近似 分 布 的 确切 程度 . 
假设 ”我 们 只 分 析 双 边 检验 ， 单 边 检验 可 与 5.7 节 中 的 Wilcoxon 符号 秩 检验 方法 相 
比较 得 到 . 
Ho:E(D)=0 (B E(X) = E(Y)) 
Ho: E(D) # 0 (BE E(X) = E(Y)) 
如 果 统 计量 T, >w RE T, <w。s， 则 以 水 平 a 拒绝 H,， 其 中 分 位 数 w, 的 用 
如 下 方法 求 得 . 


+ 
— 
2 


413 
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我 们 只 考虑 D, 的 绝对 值 | D, | ， 而 不 考虑 原来 它们 是 正 还 是 负 ， 那么 ， 共 有 2” 种 
方法 给 这 些 所 得 绝对 值 加 上 正 负 号 ， 例如， 我 们 把 正 号 加 在 所 有 的 1D, | 上， 把 正 号 
只 加 在 |D, | 上 ， 而 把 负 号 加 在 1D, | 到 |D, | 上 ， 等 等 ， 为 了 找到 p 分 位 数 w,， 其 中 0 
<p<1, 首先 找到 (2")(p) 种 符号 的 排列 可 以 得 到 次 序 最 小 的 T，( 正 的 绝对 差 ). 
[如 果 (2") (P) 不 是 一 个 整数 ， 就 取 大 于 它 的 第 一 个 整数 . ] 由 此 得 到 最 大 的 T, 值 就 
是 零 假 设 下 的 p 分 位 数 w,。[ 如 果 (2")(p) 是 一 个 整数 ， 则 分 位 数 是 T, 的 最 大 值 的 
平均 值 ， 一 般 考虑 是 (2")(p) 与 (2")(p) +1 种 排列 时 两 个 最 大 T, 值 的 平均 ]. 

ERR w, 的 方法 在 理论 上 可 以 应 用 于 所 有 的 0<p<1, 但 是 在 实际 情况 下 ， 
我 们 往往 只 需要 求 较 小 的 p， 如 p =a/2， 对 于 p 值 较 大 的 情况 ,我们 可 以 用 如 下 
关系 求 得 

Wi-a/2 = > ID;| — wa | (3) 


(3) 式 的 结论 是 显而易见 的 ， 因 为 只 须 将 每 一 个 获得 次 序 较 小 的 T, 值 的 符号 改变 成 
相反 号 (用 正 号 代替 负 号 或 用 负 号 代替 正 号 ) ， 我 们 就 可 以 得 到 相应 次 序 较 大 的 T,. 
用 后 一 个 T 的 值 RAER |D A) 加 上 前 一 个 的 值 (所 有 负 的 1D;| 的 和 ) 


就 得 到 了 > 六 | ， 即 (3) 式 中 的 关系 . 


通过 计算 得 到 小 于 (或 者 是 大 于 ， 如 果 T > 上 Y |D,| ) 或 等 于 了 值 的 这 种 符 


号 排列 方法 的 个 数 ， 其 中 T, 由 数据 计算 而 得 ,我们 就 可 以 求 得 p- 值 ， 因 为 只 要 将 所 
得 的 个 数 乘 以 2， 然 后 再 除 以 2”) ， 即 为 p- 值 . 
计算 机 辅助 ”StatXact 可 通过 考虑 所 有 可 能 出 现 的 置换 方式 求 得 该 Fisher 随机 化 检验 
的 精确 p- 值 ， 对 于 置换 方式 太 多 的 情况 可 以 通过 随机 选取 其 中 足够 多 的 样本 来 估计 
P- 值 . | 
例 5. 11. 2 
假设 从 8 组 配对 的 数据 中 计算 出 的 差 为 ，-16, -4, -7, -3,0, +5, +1, -10， 去掉 
0 后 ,我 们 得 到 ， 
D; = -16, D, = -4 Di = —7, D, = —3, Ds = +5, D, = +1, D; = -10 


其 中 n=7， 对 于 零 假设 


Ho: doso = 0 
对 备 择 假 设 
Hi:doso # 0 
在 =0.05 水 平 下 ， 使 用 随机 化 检验 . 
考虑 最 小 次 序 “ 正 的 ”绝对 值 和 的 4 [ (2') (0.025) =3.2] 种 符号 排列 方 
式 ， 我 们 可 以 得 到 分 位 数 zeos， 如 下 给 出 ， 


S. 


=o 
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符号 的 排列 Z“ 正 的 "|D| 
-16, —4, -7, —3, -5 —1, —10 T, = 0 
二 T, =1 
-16, —4, —7, +3, —5, —1, —10 T, = 3 
—16, —4, —7, +3, —5, +1, —10 T, = 4 


( —16, +4, —7, —3, —5, —1, 一 10 也 给 出 了 T, = 4) 
T, 的 最 大 值 是 4， 所 以 
woo025 = 4 
从 (3) 式 我 们 得 到 
7 
1700975 = > ID,| — woos = 46 — 4 = 42 
由 数据 得 到 检验 统计 量 的 值 为 : 
T = 之 正 的 Di=5+1=6 
因为 得 到 检验 统计 量 的 值 ， 既 不 小 于 6， 又 不 大 于 42， 因 此 接受 H,. 
Pp- 值 可 从 列 出 导致 T, <6 的 符号 排列 中 获得 ， 除 了 上 述 已 列 出 的 5 种， 还 有 


符号 的 排列 > “ 正 的 ”|Di| 
—16, +4, —7, —3, 一 5 +1, —10 T, = 5 
-16, —4, —7, —3, +5, +1, —10 T, = 5 
—16, —4, —7, —3, +5, +1, —10 T, = 6 


共有 8 种 符号 排列 的 方式 给 出 了 统计 量 小 于 或 等 于 T 的 值 . 因为 这 是 一 个 双边 检 
验 ，8 种 方式 需 乘 以 2， 从 而 ,得 到 的 p- 值 是 


2” 18 ` E 
Omit ”随机 化 检验 背后 的 理论 可 以 部 分 地 通过 求 临界 域 的 方法 来 解释 、 例 如 ， 检 
验 两 个 独立 样本 的 时 候 ， 很 明显 ， 我 们 考虑 每 一 种 从 n+m 个 观测 中 选择 nr 个 XX 的 方 
式 具 有 等 可 能 性 ， 剩 下 的 需要 解释 为 什么 我 们 考虑 的 选择 是 等 可 能 性 的 ， 以 及 为 什 
么 我 们 把 观测 值 本 身 当 作 “ 样 本 空间 ”， 下 面 加 以 解释 . 
我 们 所 考虑 的 选择 方式 是 等 可 能 性 的 ， 这 是 因为 零 假 设 (包括 假定 条 件 ) 说 明 
X 和 YY 所 有 都 是 独立 同 分 布 的 . 因此 XX 不 应 该 比 Y 有 更 低 、 或 者 更 高 、 或 者 在 中 间 
的 趋势 ， 任 意 给 定 一 组 n+m 个 数 ， 不 管 它 们 是 否 为 观测 ， 每 一 个 含有 其 中 个 数 的 
子 集 都 可 能 是 了 的 nn 个 值 ， 就 像 任意 其 他 含有 nn 个 数据 的 子 集 一 样 ， 因 为 这 些 数 据 
不 是 来 自 X 就 是 Y， 而 这 些 数 据 子 集 上 的 概率 也 不 取决 于 它们 是 来 自 和 还 是 Y M 
E, WRX 与 Y 的 分 布 不 同 ， 则 数据 是 来 自 X 还 是 Y 就 会 有 影响 ， 但 是 对 于 为 了 得 
水 平 为 a 的 临界 域 ， 我 们 限制 随机 变量 是 独立 同 分 布 的 . 因此 在 直觉 上 我 们 认为 所 
考虑 的 了 的 n 个 观测 的 选择 方式 是 等 可 能 的 . 
这 也 引出 了 第 二 个 问题 ,“ 为 什么 我 们 将 观测 值 本 身 作为 样本 空间 ”"? 我 们 前 面 
已 经 解释 过 ， 任 何 m+n 个 数据 的 集合 可 满足 “等 可 能 性 ”的 要 求 ， 但 是 在 检验 时 ， 
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我 们 需要 确认 所 得 到 的 m +n 个 观测 ， 就 是 这 m+n 个 数 . 在 秩 检 验 中 ,使 用 的 m+n 
个 数 是 从 1 到 m+n 的 整数 ， 并 且 它 们 作为 秩 赋 给 观测 值 与 观测 之 间 建 立 了 一 一 对 
应 .在 这 种 情况 下 ， 我 们 使 用 观测 本 身 作 为 数 ， 这 就 消除 了 如 何 赋 数 到 观测 值 上 的 
问题 ， 这 一 问题 在 秩 检验 中 ， 当 有 结存 在 时 ， 会 使 赋 秩 方法 比较 困惑 ， 通 过 把 观测 
本 身 作为 数 来 使 用 ， 可 以 很 简单 地 将 n 个 数字 的 一 个 选择 确认 为 一 个 实际 得 到 的 数 
据 ， 然 后 借助 于 检验 统计 量 ， 可 以 确认 超过 这 个 统计 量 所 有 极端 值 的 选择 方式 、 计 
数 、 并 且 用 于 计算 p- 值 . 

临界 域 是 由 样本 空间 的 个 体 子 集 所 确定 的 ， 如 那些 与 数据 中 观测 值 有 相同 数值 
结果 的 子 集 ， 这 些 子 集 互 不 相 容 ， 覆 盖 了 所 有 的 样本 空间 (给 定 任 何 观测 集 ， 我 们 
能 求 得 这 个 样本 空间 子 集 的 临界 域 ) ， 并 且 每 一 个 子 集 具 有 一 个 与 整个 子 集 大 小 有 
关 ， 水 平 为 a 的 临界 域 ， 因 此 ， 组 合 所 有 临界 域 的 总 体 水 平 也 是 a ,说明 这 是 一 个 
有 效 的 检验 . 

两 个 独立 样本 检验 和 配对 检验 的 主要 区 别 是 在 配对 检验 中 ， 对 称 性 的 假设 用 于 
说 明 改 变 代数 符号 而 不 改变 概率 ， 当 它 的 分 布 关于 零 对 称 时 ， 如 果 差 D, 是 +6， 那 么 
出 现 -6 的 概率 也 是 同样 的 ， 再说， 使 用 什么 数 是 没有 关系 的 .Wilcoxon 检验 使 用 
秩 ， 随 机 化 检验 使 用 观测 本 身 作 为 数 ， 以 便 我 们 可 以 对 于 一 组 实际 获得 的 数据 很 容 
易 确 认 符 号 的 排列 . 口 

Fisher( 1935) 讨论 过 配对 的 随机 化 检验 ， 两 个 独立 样本 的 随机 化 检验 是 Pitman 
(1937/1938) 提 出 的 ， 同 时 他 还 阐述 了 相关 性 的 随机 化 检验 和 方差 分 析 检 验 . 

Chung 和 Fraser ( 1958 ) 提出 了 多 维 数 据 的 随机 化 检验 . Welch ( 1937 ) , Scheffé 
(1943 ) ,Moses( 1952 ) ,Smith( 1953 ) 和 Kempthorne( 1955) 在 他 们 的 文章 中 给 出 了 随机 
化 检验 的 进一步 讨论 ，Sen(1967b) 在 他 的 文章 中 讨论 了 多 样本 置换 检验 ，Colllier 和 
Baker( 1963 ,1966) 和 Cleroux(1969 ) 讨论 了 有 用 的 检验 统计 量 分 布 的 通 近 .讨论 Fish- 
er 随机 化 检验 的 其 他 文章 包括 Tsutakawa 和 Yang( 1974) , Oden 和 Wedel(1975 ) ,Boy- 
ett 和 Shuster( 1977) 以 及 Soms( 1977). 


习题 
l. 一 个 轮胎 公司 对 10 名 顾客 进行 跟踪 研究 ， 这 10 名 顾客 是 从 3 年 前 在 他 们 公司 买 新 轮胎 的 顾 
客 中 随机 选择 的 ， 问 他 们 遇 到 过 多 少 次 (不 管 任何 原因 造成 的 ) 轮胎 故障 ， 如 钉子 ， 阀 漏 ， 


等 等 ， 这 个 研究 限制 在 两 个 长 寿命 轮胎 线 上 ， 称 为 A 品牌 和 B 品牌 .下面 是 数据 结果 . 
顾客 A 品牌 B 品牌 
1 0 3 

2 2 5 

3 0 1 

4 1 4 

5 2 3 | 

用 Fisher 随机 化 检验 方法 来 得 到 检验 零 假 设 : 轮胎 故障 等 可 能 ， 单 边 备 择 假设 为 : A 品牌 


的 轮胎 故障 更 少 的 精确 p- 值 . 
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2. 取 8 个 成 人 的 随机 样本 ， 问 他 们 第 一 次 约会 的 年 龄 . 3 位 男士 回答 是 15,17,16 2, 而 5 
名 女士 则 回答 12 ,14,15 ,10 和 12， 检验 假设 : 两 种 性 别 的 平均 年 龄 是 相同 的 ， 备 择 假 设 
是 : 女孩 子 第 一 次 约会 的 年 龄 倾向 于 比 男 孩子 更 年 轻 . 

3. 每 小 时 观测 两 名 售货员 服务 的 顾客 数 ， 记 录 差 Y, -X,， 其 中 Y; A X, 分 别 代表 每 名 售货员 
服务 的 顾客 数 ， 检 验 : 差 Y -X 的 中 位 数 是 否 可 以 认为 是 零 ， 观 测 的 差 是 +7, +3, +2, 
+8,-2,+3,+4 4-1. 

4. 2 名 高 速 公 路 巡警 检查 他 们 ?7 天 所 开 的 交通 罚单 数 ，Y 和 X,， 配 对 观测 (Xi,Y;) A (17, 
14), (15,14), (12,15), (9,7), (17,16), (18,18) 和 (14,10), ， 问 Y - X, 的 中 位 数 
EFU? 


思考 题 


l. 某 人 建议 在 两 个 独立 样本 的 随机 化 检验 中 ， 从 所 有 观测 里 减 掉 一 个 常数 ， 使 得 计算 更 简 
单 ， 如 在 习题 2 中 ， 在 分 析 数 据 前 从 每 个 观测 中 减 掉 10， 这 会 影响 检验 结果 吗 ? 请 解释 . 
从 观测 中 除 掉 一 个 非 零 带 数 会 影响 结 采 吗 ? 

2， 配对 随机 化 检验 的 结果 会 受 从 所 有 的 观测 中 减 掉 一 个 常数 或 除 掉 一 个 非 零 常数 的 影响 吗 ? 
请 解释 . 

3. 在 相关 性 的 随机 化 检验 中 ， 如 在 秩 相关 性 检验 中 ， 临 界 域 的 确定 假设 了 每 对 X 和 Y 是 等 
可 能 的 ， 其 中 数据 是 由 二 维 样本 (X,Y,),i=1,2,…,n 组 成 .解释 如 何 求 得 在 零 假设 X 
和 YY 独立 下 ,检验 统计 量 T, = EGY 的 pp 分 位 数 Wp 
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这 一 章 所 讲述 的 大 部 分 非 参数 方法 是 一 些 对 数据 应 用 秩 变换 方法 的 例子 〈 即 用 
秩 替 换 数 据 ) ， 然 后 再 使 用 通常 的 参数 方法 ， 此 时 针对 秩 而 不 是 对 于 真实 数据 ， 我 们 
在 5.4 节 提 到 了 秩 变 换 最 明显 的 应 用 ， 就 是 把 通常 的 乘积 矩 相 关系 数 ， 即 熟知 的 
Pearson y 应 用 到 秩 上 ， 可 得 到 Spearman p. 在 5.6 节 中 ， 我 们 对 秩 而 不 是 对 原始 数据 
求 出 了 通常 的 最 小 二 乘 回 归 线 ， 

其 他 的 非 参 数 方法 ， 如 Mann-Whitney 检验 ，Wilcoxon 符号 秩 检 验 ，Kruskal- 
Wallis 检验 ， 就 不 是 很 明显 的 秩 变换 . 让 我 们 下 面 考查 一 下 Mann-Whitney 检验 . 

5. 1 节 中 的 Mann-Whitney 检验 考虑 了 两 个 随机 样本 ， 看 它们 所 来 自 的 两 个 总 体 
是 否 具 有 相同 的 均值 ， 如果 总 体 是 正 态 时 ， 则 两 样本 的 上 检验 是 最 有 功效 的 检验 ， 它 
是 通过 比较 由 (5.1.17) 式 给 出 的 统计 量 1 与 服从 自由 度 为 N -2 的 学 生 上 分 布 的 分 
位 数 来 进行 的 ， 其 分 位 数 由 表 A21 给 出 . 

非 参 数 的 Mann-Whitney 检验 没有 总 体 是 正 态 性 的 假设 , 它 是 通过 比较 由 
(5.1.2) 式 给 出 的 统计 量 T, ， 与 作为 其 精确 分 布 逼近 的 正 态 分 布 来 进行 的 . 

如 果 我 们 比较 由 秩 构 造 的 1 统计 量 ( (5.1.17) 式 ) 而 不 是 由 数据 构造 的 统计 
量 ， 结 果 将 如 何 呢 ? 结果 显示 这 一 方法 等 价 于 Mann-Whitney 检验 ， 只 是 用 了 不 同 的 


K 


[417] 


[418] 


38 第 5 章 # #£ 验 


逼近 分 布 ， 换 句 话说 ， 令 e 为 由 (5.1.17) 式 计 算出 的 基于 秩 而 不 是 观测 本 身 的 t 
统计 量 ， 则 这 个 基于 X 和 Y 秩 计算 的 两 样本 统计 量 是 


ta = ———————— (1) 


HA. "4 T 增 大 时 ， te EISA, T 减 小 时 ，ts 也 减 小 ， 这 就 意味 着 如 果 检 验 因为 T 
太 大 或 者 太 小 而 拒绝 零 假设 ,那么 检验 也 同样 会 因为 te 太 大 或 者 太 小 而 拒绝 零 假 设 . 
所 以 两 种 检验 ， 即 Mann-Whitney 检验 和 秩 变 换 方 法 确实 是 等 价 的 ， 只 要 将 也 的 
0.95 分 位 数 代 入 (1) ERE r 的 0.95 分 位 数 . 但 结果 与 从 自由 度 为 N-2 的 1 分 
布 中 求 得 的 0. 95 分 位 数 ( 见 表 A21) 不 是 完全 一 样 ， 而 后 者 是 当 精 确 值 不 知道 时 ， 
对 精确 值 的 一 个 很 好 的 近似 ， 所 以 基于 T, 和 ti 的 检验 是 等 价 的 检验 . 

在 5.2 节 中 ，(5.2.3) 式 给 出 了 Kruskal-Wallis 检验 统计 量 了 ，(5.2.19) 式 给 出 
了 在 单 因素 方差 分 析 中 使 用 的 统计 量 F， 基 于 观测 的 秩 计 算 的 统计 量 是 一 个 7 
的 函数 : 

N- x PN =k) (2) 
并 且 ， 因 为 F, 随 着 统计 量 了 的 上 升 而 上 升 ，T 的 下 降 而 下 降 ， 所 以 秩 变 换 方法 等 价 
F Kruskal-Wallis 检验 方法 ( 见 思考 题 5.2.5). 

我 们 现在 来 看 Wilcoxon 符号 秩 检验 ， 这 个 检验 应 用 到 一 个 差 的 随机 样本 D, 
D,,…,D,， 用 于 检验 均值 相等 的 零 假设 ， 即 E(D,) =0. 通常 的 参数 方法 需要 假设 D, 
是 来 自 于 正 态 分 布 的 随机 样本 ， 当 由 (5.7.18) 式 给 出 的 1 统计 量 过 大 或 者 过 小 时 拒 
绝 零 假设 ， 称 它 为 单 边 的 检验 ， 我们 早 在 5.7 节 中 提 到 过 它 ， 对 于 Wilcoxon 符号 秩 
检验 ， 用 符号 秩 (细节 见 5.7 节 ) R, 到 R 代替 D;,， 并 且 当 由 (5.7.5) 式 给 出 的 T 
统计 量 过 大 或 者 过 小 时 拒绝 零 假 设 ， 秩 变换 方法 建议 ， 通 过 使 用 符号 秩 计算 统计 量 r 
来 构造 一 个 新 的 检验 ， 但 是 这 个 检验 实际 上 并 不 新 ， 因 为 基于 符号 秩 的 一 样本 1 统计 
E, BH 仅 是 一 个 关于 Wilcoxon 符号 秩 统计 量 T 的 一 个 函数 ， 表 示 如 下 〈 见 思考 题 
5.7.3); 


Fr 


J 


bg = ——— p 
| n B 1 r) 
n—-1 n-1 


而 且 ， 大 的 T 值 对 应 于 大 的 te 值 ， 小 的 T 值 对 应 于 小 的 te 值 ， 所 以 两 个 检验 是 等 
价 的 . 

这 些 例子 以 及 本 章 中 的 其 他 例子 ， 如 5.5 节 中 关于 斜率 的 检验 ，Friedman 检验 ， 
以 及 Durbin 检验 ， 都 表达 了 一 种 思想 ， 即 应 用 通常 的 参数 检验 统计 量 以 及 对 应 观测 
的 秩 来 获得 一 个 非 参数 方法 ， 在 大 多 数 情况 下 ， 它 具有 较 高 的 效率 当然， 对 每 一 
情形 ， 以 这 种 方法 给 观测 赋 秩 的 妙 处 是 在 零 假设 下 ， 每 一 种 可 能 的 赋 秩 方式 都 是 等 
可 能 的 ，Worsley(1977) 把 这 一 技巧 成 功 地 利用 到 聚 类 分 析 ，Shirley(1977) 也 利用 这 


(3) 
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一 技巧 对 比 了 一 种 处 理 的 增长 剂量 水 平 . 

这 些 非 参 数 检 验 等 价 于 在 秩 上 计算 的 参数 检验 ， 它们 可 以 较 容易 地 用 计算 机 中 
计算 参数 检验 设计 的 程序 求 出 ， 在 没有 非 参 数 检验 的 计算 机 程序 时 ， 我 们 可 以 给 数 
据 简单 地 赋 秩 ， 然 后 对 秩 使 用 参数 检验 的 方法 ， 人 参数 检 验 能 自动 地 对 结 进行 修正 ， 
这 就 使 得 一 般 近 似 的 p- 值 比 通常 由 正 态 分 布 或 者 x 分 布 得 到 的 近似 要 好 . 

在 这 种 赋 秩 方法 不 可 能 或 者 很 困难 的 情况 下 ， 秩 变换 的 原则 依然 有 用 既 使 不 
能 得 到 非 参 数 检验 ， 但 在 试验 设计 和 多 元 回归 两 个 统计 分 析 方 面 ， 秩 变换 方法 是 很 
有 用 的 . 

为 了 分 析 秩 变换 在 试验 设计 中 的 应 用 ， 首 先 从 最 小 到 最 大 对 所 有 的 观测 赋 秩 ， 
然后 对 秩 使 用 通常 的 方差 检验 ， 其 结果 是 一 个 条 件 分 布 自由 的 方法 . 

也 就 是 说 ， 在 秩 检验 中 可 以 得 到 一 个 检验 统计 量 的 精确 分 布 ， 但 是 对 于 不 同 的 
秩 结构 ， 分 布 是 不 同 的 . 即 想 找 精确 分 布 并 不 实际 ， 所 以 在 很 多 情况 下 ， 将 使 用 大 
样本 逼近， 这 与 参数 检验 中 所 使 用 的 到 分 布 基本 相同 . 

秩 变 换 可 以 很 好 地 处 理 没有 交互 作用 的 双向 表 〈 见 Iman, Hora， 和 Conover, 
1984， 以 及 Hora 和 Iman ,1988) ， 此 时 它 比 Friedman 检验 ，Quade 检验 以 及 参数 的 
检验 要 好 ， 但是， 试图 对 交互 作用 使 用 秩 变换 方法 进行 检验 却 没 有 得 到 一 致 的 结论 ， 
在 一 些 情 况 下 ， 它 具有 很 好 的 稳健 性 和 效率 ， 参 见 Iman ( 1974b) , Conover 和 Iman 
(1976) 以 及 Pavur 和 Nath (1986) ， 但 是 在 另 一 些 情 况 下 ，Blair, Sawilowsky 和 Hig- 
gins( 1987 ) 却 说明 这 一 检验 是 不 稳健 的 ， 效 率 也 不 高 ，Thompson(1991) 作 了 一 个 理 
论 上 的 研究 ， 指 出 了 秩 变换 检验 在 检验 交互 作用 时 的 缺点 ， 说 明 它 不 是 一 个 有 效 的 
方法 ， 不 应 当 使 用 它 . 但 是 Mansouri 和 Chang ( 1995) 用 正 态 得 分 代替 秩 ， 并 发 现 用 
正 态 得 分 变换 方法 检验 交互 作用 没有 问题 ， 所 以 正 态 得 分 的 转化 可 以 修正 Thompson 
发 现 的 缺点 . 

在 试验 设计 中 ， 对 于 那些 非 参 数 检验 不 存在 的 情况 下 ， 一 个 值得 推荐 的 方法 就 
是 用 通常 的 方差 分 析 分 析 数 据 ， 然 后 使 用 相同 的 方法 分 析 秩 变换 数据 ， 如 果 两 个 方 
法 给 出 了 几乎 相同 的 结果 ,那么 通常 方差 分 析 的 基本 假设 可 能 比较 合理 ,通常 的 参 
数 分 析 方 法 也 是 有 效 的 . 当 两 个 方法 给 出 了 完全 不 同 的 结论 ， 那 么 试验 者 可 能 需要 
认真 观察 一 下 数据 ， 特 别 是 那些 离 群 值 (与 一 般 数 据 相 比 大 得 出 奇 的 值 ) 或 者 是 特 
别 不 对 称 的 分 布 ， 这 些 数据 中 的 失常 现象 会 很 大 程度 上 改变 显著 水 平 ， 降 低 效 率 ， 
但 是 基于 秩 的 分 析 就 不 会 受到 同样 大 的 影响 . Crouse ( 1967 ) Lemmer 和 Stoker 
(1967), Crouse( 1968), Macdonald( 1971 ) , Scheirer, Ray 和 Hare( 1976) ， 以 及 Hamil- 
ton(1976) 在 试验 设计 中 使 用 了 秩 变换 方法 ， 更 多 近期 的 研究 参见 Akritas( 1990 和 
1991). 

在 多 元 回归 中 ， 对 每 一 个 变量 分 别 进 行 赋 秩 ， 就 像 在 5.5 节 中 提 到 的 二 元 回归 
方法 ， 然 后 在 秩 上 应 用 通常 的 回归 方法 ， 结 果 得 到 一 种 稳健 的 回归 分 析 方 法 ， 它 不 
像 一 般 的 回归 方法 对 于 离 群 值 或 是 非 正 态 分 布 那样 十 分 敏感 ， 因 此， 如 前 面 提 到 的 ， 
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建议 通过 分 析 数 据 、 分 析 秩 ， 并 从 两 个 角度 分 别 对 结果 进行 解释 . 对 于 相关 变量 的 
预测 在 5. 6 节 中 已 经 进行 了 分 析 ， 通 过 由 回归 方程 预测 秩 ， 以 及 在 相关 变量 的 已 知 值 
中 使 用 差 值 的 方法 .Iman 和 Conover(1979) 给 出 了 使 用 这 个 方法 的 例子 . 

秩 变换 在 判别 分 析 中 的 应 用 使 得 得 出 的 方法 很 简单 ， 并 且 在 给 观测 分 类 时 很 有 
效 . 简单 地 说 ， 分 别 赋 秩 给 每 一 个 变量 ， 基 于 秩 计 算 线 性 判别 方程 和 二 次 判别 晒 数 . 
Conover 和 Iman(1978b ,1980) 给 出 了 这 个 方法 一 个 更 详细 的 讨论 ， 并 且 用 蒙特 卡 罗 
方法 进行 了 大 量 功效 比较 . 

统计 学 的 其 他 领域 也 可 以 更 多 地 运用 秩 变换 方法 ， 这 些 方法 通常 不 是 分 布 自 
由 的 . 但 是 当 标 准 方法 的 假设 不 合理 时 ， 它 们 比 标准 过 程 更 加 稳健 而 且 经 常 更 有 
效 ， 参 考 Hettmansperger 和 Mckean( 1978 ) 对 使 用 秩 进行 的 一 般 性 讨论 .其 他 稳健 
方法 ， 不 一 定 是 基于 秩 的 ， 现 在 也 受到 了 很 大 的 关注 . 有 关 这 些 稳健 方法 的 一 些 
重要 参考 文献 包括 Huber(1972) 和 Hogg(1977). Labovitz(1970) 和 Allan(1976) 也 
讨论 了 这 些 方法 ，Kim(1975 ) 的 文章 列 出 了 许多 这 方面 的 参考 文献 . 
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l. 州 高 速 公路 管 委 会 希望 买 一 种 比较 好 的 油漆 ， 喷 刷 高 速 公路 上 的 标志 线 ， 最 后 确定 要 在 
两 种 品牌 的 油漆 中 选 一 种 ， 在 高 速 公路 的 一 段 涂 上 20 条 条 纹 ， 其 中 用 品牌 A 涂 10 Z, 
品牌 B 涂 10 条 ， 顺 序 是 随机 的 .并且 6 个 月 后 分 别 检查 这 些 条 纹 ， 并 根据 磨损 程度 排 

J. 得 到 的 结果 如 下 : 


, 9, 10, 12, 13, 14 
1, 15, 16, 17, 18, 19, 20 


品牌 A 和 B 的 差别 是 否 显著 ? 


2. 在 珠宝 商店 中 金 戒 指 有 两 种 不 同 尺度 测 重 ， 尺 度 A 是 电子 测量 ， 尺 度 B 是 机 械 式 天 平 测 


量 ， 为 了 看 用 尺度 B 测量 的 重量 是 否 高 于 尺度 A 的 测量 ， 我 们 用 两 种 尺度 分 别 测量 了 ?7 枚 
金 戒 指 ， 结 果 如 下 . 那么 ,用 尺度 B 测 得 的 重量 比 用 尺度 A 测 得 的 重量 显著 重 吗 ? 
戒指 ”尺度 A 尺度 B 


1 22.6 22.9 
2 13.8 14.3 
3 19.0 19.1 
4 26.5 26.4 
5 24.9 25.2 
6 16.0 16.4 
7 23.3 23.4 


(a) 使 用 Fisher 随机 化 检验 . 
(b) 使 用 Wilcoxon 符号 秩 检 验 . 


3. 10 位 高 尔 夫 球 手 同意 在 一 次 锦标 赛 中 试验 一 种 新 球 ， 从 这 10 位 选手 中 随机 地 选取 5 位 使 


用 新 球 ， 其 他 的 5 位 使 用 旧 球 ，4 轮 后 结果 如 下 ， 
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新 球 得 分 295 301 288 290 289 
旧 球 得 分 302 306 292 306 314 
(a) 这 些 结果 是 否 提供 了 使 用 新 球 会 倾向 于 得 分 降低 的 证 据 ? 
(b) 在 步骤 (a) 中 还 可 以 使 用 什么 统计 方法 进行 分 析 ? 它们 分 别 有 什 么 优点 和 缺点 ， 包 
括 你 所 使 用 的 方法 ? 
一 个 球 童 在 等 人 的 过 程 中 ， 看 见 8 名 高 尔 夫 球 手 在 完成 比赛 后 ， 付 钱 给 了 他 们 各 自 的 球 
童 ， 然 后 离开 了 .他 估计 了 每 一 个 选手 的 年 龄 ， 并 记 下 了 他 们 和 付 给 球 童 的 报酬 . 


高 尔 夫 球 选手 
1 ý 3 4 5 ri 8 
年 龄 (估计 的 ) 32 30 33 41 43 47 28 30 
支付 总 额 10.00 11.50 9.00 12.00 16.00 1700 875 10.50 


(a) 这 些 数 似乎 说 明年 龄 越 高 的 人 给 球 童 的 报酬 越 高 吗 ? 

(b) 在 步骤 (a) 中 还 可 以 使 用 什么 统计 方法 进行 分 析 ? 它们 分 别 有 什 么 优点 和 缺点 ， 包 
括 你 所 使 用 的 方法 ? 

两 位 赛马 训练 师 要 比较 他 们 最 新 训练 的 5 匹 马 的 比赛 结果 ， 看 谁 是 训练 赛马 跑 得 更 快 的 

人 ， 下 表 给 出 了 第 一 个 训练 师 所 训练 的 马 跑 1⁄4 英里 所 需 的 时 间 ， 


> 
1 2 3 4 5 


训练 前 — 263 241 276 253 268 

训练 后 233 220 241 228 23.0 
下 表 给 出 了 第 二 个 训练 师 所 训练 的 马 跑 1⁄4 英里 所 需 的 时 间 . 

马 
1 2 3 4 5 

训练 前 254 262 240 26.0 277 

训练 后 236 239 218 236 257 
检验 假设 : 两 位 训 马 师 训 练 的 马 跑 得 一 样 快 . 
为 了 检验 进一步 训练 是 否 必要 ， 我 们 按 顺 序 记录 了 同一 匹 马 在 10 天 内 每 天 早晨 跑 1⁄4 K 
里 所 需 的 时 间 ， 结 果 如 下 

天 1 2 3 4 5 6 zi 8 9 10 

速度 ( 秒 ) 222 228 210 214 224 29 20 26 218 211 
这 些 数据 是 否 说 明 这 匹 马 的 速度 还 可 以 提高 ? 
随机 选择 18 个 高 中 学 生 ， 对 他 们 进行 品行 评分 X,X = 10 代表 满分 ; 成 绩 评分 为 Y,Y =20 
代表 20 门 课程 中 每 一 个 都 得 到 满意 成 绩 . 


+ 
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10. 


(a) X 和 Y 之 间 有 显著 的 正 相 关 吗 ? 
(b) 求 出 最 小 二 乘 回 归 直 线 . 
(c) 求 出 最 小 二 乘 回归 直线 斜率 的 95% 置信 区 间 . 
(d) 用 秩 回 归 估 计 回 归 曲 线 E( YIX). 
(e) 画 一 幅 图 ， 在 图 上 给 出 数据 点 ， 最 小 二 乘 回 归 直 线 ， 及 其 用 秩 回 归 的 单调 句 归 曲线 
估计 .哪个 回归 估计 看 起 来 与 数据 更 一 致 ? 

随机 选择 男士 和 女士 组 成 一 个 样本 ， 其 身高 (英寸 ) 如 下 所 示 ， 

男士 J 

X =701 Y= 62.2 

, = 67.8 Y;= 64.7 

X,=716 Y, = 65.3 
检验 零 假设 : 男士 和 女士 的 身高 同 分 布 ， 对 备 择 假设 : 男士 倾向 于 比 女 士 更 高 些 . 令 检 
验 统计 量 T 为 赋予 Y 的 最 大 的 秩 ， 其 中 以 高 度 增加 为 序 ， 将 秩 1 到 秩 6 赋 给 男女 联 
合 样 本 . 
(a) 求 了 在 零 假 设 下 的 概率 分 布 . 
(b) 求 了 在 零 假 设 下 的 概率 分 布 函数 ， 并 绘图 . 
(c) 求 一 个 合理 的 临界 域 ， 并 找 得 显著 水 平 . 
(d) 用 前 面 的 检验 来 检验 零 假设 . 
(e) 用 你 所 学 过 的 或 发 明 的 其 他 非 参 数 方 法 检验 零 假设 . 
在 新 学 年 开始 的 时 候 ， 将 一 年 级 的 学 生 随机 地 分 成 两 个 组 . 第 一 组 用 一 视 同 仁 的 方 
法 教授 阅读 ， 即 所 有 的 学 生 在 老师 指导 下 ， 在 同一 时 间 内 由 一 个 水 平 提高 到 另 一 个 
水 平 .第 二 组 用 因材施教 的 方法 教授 ， 即 每 一 个 人 根据 教材 难度 ， 并 且 在 老师 的 辅 
导 下 ， 按 照 他 或 她 自己 的 速度 进行 学 习 . 年 底 时 ， 每 一 个 学 生 都 接受 了 一 项 阅读 测 
验 ， 结 果 如 下 . 


第 一 组 第 二 组 
227 55 184 174 29 271 63 19 
176 234 147 194 14 151 184 127 
252 194 88 248 165 235 53 151 
149 247 161 206 171 147 228 101 
16 99 171 89 292 99 271 179 


(a) 检验 零 假 设 : 两 种 教学 方法 的 效果 没有 区 别 ， 对 备 择 假设 : 两 个 总 体 均 值 
不 相等 . 

(b) 检验 零 假设 : 两 个 总 体 方差 相等 ， 对 备 择 假 设 : 第 二 种 方法 的 总 体 方差 大 于 用 统一 
方法 教授 阅读 的 总 体 方差 . 

一 所 学 校 有 121 名 学 生 ， 一 个 学 期 学 生 缺 课 人 数 汇总 如 下 : 


超过 

缺 课 次 数 0 39 š S. 8. 9 & B 
学 生 数 54 3 10 4 5 5 3 0 1 7 
iir A D O & 2 Q. h. 0 D. 5 
(女生 ) 26 17 6 2 3 3 2 0 1 4 
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(a) 讨论 这 个 问题 中 “目标 总 体 ” 和 “样本 总 体 ” 的 概念 . 
(b) 女孩 比 男孩 出 勤 记录 更 少 吗 ? 
(c) 女孩 一 般 倾 向 于 比 男孩 缺 课 更 多 吗 ? 
ll. 在 一 次 地 区 级 才艺 竞赛 中 ， 要 求 7 名 考官 给 5 个 进入 决赛 的 人 排序 ， 赋 秩 从 最 好 的 1 到 


最 差 的 5， 结 果 如 下 ， 423 
表演 者 
裁判 A B C D E 
1 5 2 1 3 4 
2 5 1 2 3 4 
3 3 1 2 4 5 
4 2 3 4 1 5 
5 3 1 2 5 4 
6 4 1 2 3 5 
7 4 2 3 1 5 


问 秩 是 随机 排列 的 零 假 设 会 被 拒绝 吗 ? 
12. 某 公司 希望 从 5 种 不 同类 型 的 梳子 中 选 出 一 种 做 营销 推广 的 重点 ， 作 为 分 析 的 一 部 分 ， 
他 们 选择 了 10 个 来 自 高 中 的 女孩 作为 顾客 ， 检 验 顾客 对 这 些 梳子 的 喜好 .给 这 10 个 女 
孩 中 的 每 一 个 这 两 种 类 型 的 梳子 ， 让 她 们 用 一 个 月 ， 然 后 要 求 她们 汇报 她 们 的 喜好 . 为 
了 简单 起 见 ， 将 不 同类 型 的 梳子 叫做 A,B,C,D 和 E， 结果 如 下 . 
Alice A B 中 更 喜欢 B Fawn BD 中 更 喜欢 B 
Betty A C 中 更 喜欢 A Greta B E 中 更 喜欢 下 
Charlene A DD 中 更 喜欢 D Heather C D 中 更 喜欢 D 
Donna A E 中 更 喜欢 E Inga CE 中 更 喜欢 E 
Ellen B C 中 更 喜欢 B Jean DE 中 更 喜欢 E 
喜好 有 显著 的 差异 吗 ?” 如 果 有 ， 哪 些 梳 子 有 显著 差异 ? 
13.” 几 种 普通 股票 在 一 个 时 期 内 的 投资 回报 率 可 以 这 样 计算 , 它 由 这 个 时 期 末 每 支 股票 的 市 
场 价格 加 上 这 个 时 期 内 所 付 的 一 些 股息 ， 然 后 用 次 结果 除 以 这 个 时 期 开始 时 股票 的 价格 
而 得 到 .， 儿 种 股票 的 投资 回报 率 记 录 如 下 ， 共 9 个 时 期 ， 每 期 3 个 月 . 不 同 的 股票 看 起 
来 回报 率 有 显著 差别 吗 ? 
股票 
时 期 A B C D E 


1.022 1.018 1.031 1.009 1.018 
0.996 0.998 1.021 0.981 0.992 
1.001 0.993 0.998 1.010 1.008 
1.064 1.073 1.020 1.051 1.061 
1.013 1.009 1.026 1.042 1.000 
1.113 1.126 1.088 1.141 1.103 
0.998 0.992 1.012 1.002 0.977 
0.993 1.004 1.010 0.998 0.987 
1.061 1.020 0.999 1.031 1.040 


14. 在 问题 13 相同 研究 的 另 一 部 分 中 ,计算 40 支 股票 在 9 个 时 期 、 每 期 3 个 月 中 的 总 回报 
率 ， 所 选 的 这 40 支 股 票 代表 4 种 不 同类 型 的 行业 ， 每 个 行业 有 10 支 股票 ， [424] 


N @ 1 N Q j Q hO — 


+ 


KE 


iw 


O NO QO 1 O. Q > SG) N. = 


27 个 月 的 回报 率 


A 


1.062 
1.021 
1.000 
1.316 
1.177 
1.289 
1.405 
1.566 
1.304 
1.111 


行业 类 型 
B 
1.060 
1.001 
1.124 
.961 
1.054 
1.048 
1.113 
1.147 
1.067 
1.073 


这 4 种 类 型 的 股票 看 起 来 回报 率 有 显著 不 同 吗 ? 


一 个 乡村 估价 官 记录 了 所 有 去 年 在 某 个 乡镇 附近 卖 掉 的 超过 20 英亩 土地 的 价格 ， 她 将 


C 


1.101 

.981 
1.173 
1.126 
1.002 

.964 
1.142 
1.226 
1.184 
1.098 


D 


1.003 
1.067 
1.084 
1.049 
1.056 
1.012 
1.008 
1.051 
1.058 
1.042 


等 笔 销售 的 数据 归结 为 两 个 变量 : X = 到 城市 边界 的 距离 , Y = 每 英亩 的 价格 . 


和 (英里 ) 
Y (美元 / 英亩 ) 


X (英里 ) 
Y (美元 / 英亩 ) 


要 求 她 为 每 块 位 于 离 城市 边界 4.4 英里 的 土地 提供 一 个 公平 的 市 场 价格 ， 只 考虑 前 面 的 


土地 块 
1 2 3 4 
121 48 139 1.6 
280 590 163 530 
土地 块 
8 9 10 1 
218 24 58 23 
110 620 492 761 


信息 ， 问 每 英亩 价格 应 该 是 多 少 ? 
研究 6 个 人 ， 看 他 们 早晨 的 休息 心跳 率 是 否 高 于 晚上 的 ， 结 果 如 下 : 
晚上 


Q > Q) N — > 


(a) 用 正 态 得 分 型 检验 分 析 这 些 数据 . 
(b) 求 斜率 的 90% 置信 区 间 ， 这 里 Y= 早晨 心跳 ， X= 晚上 心跳 . 
一 个 本 地 煤气 站 的 随机 样本 有 如 下 的 雇员 个 数 . 


X 


早晨 
78 
86 
64 
74 
74 
72 


4, 5, 7, 


一 个 连锁 煤气 站 的 随机 样本 有 如 下 的 雇员 个 数 ， 
9, 11, 15 


(a) 用 XX 的 秩 和 ， 在 a=0.05 下 ,检验 H: p, =u XT H: z, < 上 Ai， 求 精确 的 p- 值 


(不 用 查 表 ). 


Y 


73 
81 
64 
73 
69 
71 


12 


5 
17.4 


6 
7 


157 394 


12 


13 


7 


19.9 
177 


14 15 


128 256 88 7.3 


210 


115 


245 334 


19. 


20. 
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(b) 用 ven der Waerden 检验 . 

(c) 用 Fisher 随机 化 检验 . 

4 个 不 同 的 承包 人 生产 一 种 化 学 检测 试剂 . 假定 由 所 有 的 承包 人 生产 的 所 有 试剂 对 有 
毒 的 气体 的 检测 是 相同 的 ， 进 行 一 项 检验 看 是 否 有 这 种 情况 ， 从 每 个 承包 人 生产 的 许 
多 试剂 中 随机 抽取 10 种 ， 把 这 40 种 试验 放 入 一 个 气体 实验 室 中 ， 在 给 定 试验 条 件 下 
经 过 一 段 时 间 后 再 做 比较 .试剂 星 现 出 不 同 的 颜色 ， 把 这 些 颜 色 从 粉色 到 深 紫 色 赋 秩 
如 下 : 


4 28 32 23 
38 1 29 13 
33 15 6 16 
36 12 2 9 
39 27 30 8 
40 31 35 14 
37 205 34 17 
26 22 24 11 


由 不 同 承 包 人 生产 的 试剂 有 差异 吗 ? 
用 计算 机 模型 模拟 进行 红军 和 蓝 军 之 间 的 12 场 战斗 ， 每 次 战斗 中 每 支队 伍 的 伤亡 人 数 
记录 如 下 : 


战斗 ”红军 WE 
l 41 38 
2 8 14 
3 6 4l 
4 28 31 
5 11 8 
6 15 18 
7 73 48 
8 54 32 
9 7 7 
10 50 3 
11 59 42 
12 24 28 


(a) 画 出 数据 的 散 点 图 . 

(b) 用 Spearman p 作为 单调 相关 强度 的 度量 . 

(c) 用 Kendall 7 度量 数据 对 之 间 协 调 性 强度 . 

(d) 用 单调 回归 方法 估计 ， 当 蓝 军 有 40 名 伤亡 人 数 时 ， 红 军 的 平均 伤亡 人 数 . 

招收 8 名 自愿 者 以 检验 在 步枪 上 安装 望远镜 瞄准 器 的 效果 ， 相 信 在 步枪 上 安装 望远镜 眶 
准 器 会 提高 射击 目标 的 测试 分 数 ， 为 了 证 明 这 个 结论 ， 要 求 这 8 名 自愿 者 每 人 用 一 把 步 
枪 以 两 种 方式 射击 目标 ， 一 种 是 安装 望远镜 瞄准 嚣 ， 另 一 种 是 不 安装 ， 而 选 这 两 种 方式 
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的 次 序 是 随机 的 ， 下面 是 数据 结果 : 


自愿 者 
1 2 3 4 5 6 7 8 


安装 望远镜 瞄准 器 96 93 89 88 85 83 80 77 
没有 安装 望远镜 瞄准 器 92 92 89 9 8 79 80 78 


安装 望远镜 瞄准 器 会 得 到 较 高 的 测试 分 数 吗 ? 
(a) 用 一 个 仅 基于 秩 的 检验 ， 求 以 下 3 种 方式 的 p- 值 : 
(1) 求 精确 p- 值 . 
(2) 用 没有 连续 性 修正 的 正 态 通 近 . 
(3) 用 有 连续 性 修正 的 正 态 逼近 . 
(b) 用 基于 正 态 得 分 的 检验 . 
(c) 用 Fisher 型 的 随机 化 检验 . 
(d) 求 在 步枪 上 安装 望远镜 瞄准 器 所 获得 测试 分 数 改 进 量 的 90% 置信 区 间 . 
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在 第 2 章 中 ， 我 们 介绍 了 经 验 分 布 函数 ， 它 是 基于 随机 样本 的 函数 ， 并 且 是 可 
用 来 估计 总 体 的 分 布 困 数 ， 如 果 我 们 想 看 两 组 或 多 组 样本 是 否 来 自 同一 未 知 分 布 ， 
很 自然 ， 可 以 比较 它们 的 经 验 分 布 图 数 ， 看 它们 是 否 有 相似 之 处 ， 确 切 地 说 ， 需 要 
一 个 衡量 两 个 或 多 个 分 布 间 差 异 的 度量 . Kolmogorov 和 Smirnov tE ii AAE Y Hi R 
数 间 的 最 大 垂直 距离 作为 分 布 相似 性 的 一 种 度量 的 统计 方法 . 本 章 将 讲述 这 个 方法 
及 其 他 运用 这 种 思想 的 方法 . 


6. 1 Kolmogorov 拟 合 优 度 检 验 


本 章 中 我 们 先 讲述 Kolmogorov (1933) 提出 的 一 种 拟 合 优 度 检验 ， 这 个 检验 可 
能 是 本 章 中 最 有 用 的 检验 ， 一 部 分 原因 是 ， 它 提供 给 我 们 一 种 替代 4. 5 节 中 对 名 义 变 
量 型 数据 所 使 用 的 拟 和 优 度 X 检验 的 方法 ， 使 它 可 以 适合 于 顺序 类 型 的 数据 ， 另 一 
部 分 原因 是 ，Kolmogorov 检验 统计 量 使 我 们 能 够 构造 一 个 对 于 未 知 分 布 晒 数 的 “ 置 
信 界 ”， 这 一 点 我 们 将 在 本 节 中 解释 . 

检验 拟 合 优 度 通 常 是 考察 一 个 来 自 某 个 未 知 分 布 的 随机 样本 ,检验 其 未 知 分 布 
函数 是 否 符合 零 假 设 为 某 个 已 知 而 具体 的 分 布 ， 即 ， 零 假设 具体 指明 了 某 个 分 布 
F (x) ， 可 能 是 如 图 6-1 所 示 的 分 布 函数 ， 也 可 能 是 一 个 可 以 画 出 其 图 像 的 数学 顶 
数 ， 通 过 某 种 方式 将 一 组 来 自 于 某 个 总 体 的 随机 样本 X, ,X,,…,X, 与 F” (x) ee, Æ 
判断 已 〈(x) 为 这 组 样本 的 真实 分 布 是 否 合理 . 


F*(x) 


Dli} 


1.0 


j 
| 
| 


S atii u AEAEE LPEN SIA A ee ah 
图 6-1 假设 的 分 布 函数 


一 种 符合 逻辑 的 办 法 就 是 ， 把 随机 样本 的 经 验 分 布 函 数 SC(x) 与 F (x) fF t. 
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由 定义 2.2.1 所 述 ， 对 任 一 x( -o <x<om)， 经 验 分 布 图 数 是 和 (= 1,2,……m) 中 小 
于 或 等 于 x 的 比例 、 在 2.2 节 中 我 们 知道 ， 经 验 分 布 函数 S(x) Jë X, 的 未 知 分 布 的 一 
个 很 有 用 的 估计 ， 所 以 我 们 可 以 把 S(x) 与 所 假设 的 分 布 函 数 F”(x) 作 比较 ， 看 它们 
是 否 易 合 ， 如 果 它 们 不 能 很 好 的 吻合 ， 我 们 可 以 拒绝 零 假 设 ， 并 得 出 结论 : 此 未 知 
真实 的 分 布 函数 F(x) ， 不 是 由 零 很 设 中 的 天 (x) 给 定 的 . 

但 是 ， 我 们 能 使 用 什么 类 型 的 检验 统计 量 作为 5(x) 与 7”(x) 之 间 差 异 的 度量 呢 ? 
可 想 而 知 ， 一 个 最 简单 的 度量 就 是 用 S(x) 与 (zx) 在 垂直 方向 上 的 最 大 距离 ， 这 是 由 
Kolmogorov (1933) 提出 的 统计 量 .， 亦 即 ， 如 果 F” (x) 如 图 6-1 所 示 ， 一 组 容量 为 5 的 
样本 抽 自 这 个 总 体 ， 把 它 的 经 验 分 布 函 数 与 F* (x) 画 在 一 起 ， 如 图 6-2 PR. F (x) 
与 S(x) 给 定 ， 那 么 这 两 者 之 间 的 最 大 垂直 距离 出 现在 S(x) 的 第 三 阶 以 前 ， 这 个 距离 在 
图 6-2 中 大 约 为 0.5， 因 此 ， 在 这 种 情况 下 ，Kolmogorov 统计 量 了 就 等 于 0.5. Æ TH 
超过 表 A13 中 所 给 出 的 值 ， 则 表明 拒绝 F” (x) 作 为 未 知 真 实 分 布 F(x) 的 合理 逼近 


图 6-2 假设 的 分 布 函数 F* (x) ， 经 验 分 布 函数 以 及 Kolmogorov 统计 量 T 


在 小 样本 情形 下 ， 我 们 更 愿意 用 Kolmogorov 检验 替代 x 检验 来 拟 合 优 度 ， 即 使 
在 小 样本 情形 下 ，Kolmogorov 检验 也 是 精确 的 ， 而 检验 则 假设 样本 容量 足够 大 ， 
使 得 好 分 布 是 检验 统计 量 分 布 的 一 个 比较 好 的 近似 ， 哪 一 种 检验 更 和 有效 通常 存在 争 
j, 但 是 一 般 感觉 在 多 数 情形 下 ,包括 顺 序 型 数据 ，Kolmogorov 检验 要 优 于 Xx 检 
验 ， 想 了 解 更 多 的 这 方面 的 比较 ， 参 看 Slakter (1965). 

本 章 的 标题 是 “Kolmogorov-Smirnov Wit”, RMI S(x) 与 F”(x) 的 最 大 
垂直 距离 函数 的 统计 量 称 为 Kolmogorov 型 统计 量 ， 把 两 个 经 验 分 布 函数 最 大 垂直 距 
离 函数 的 统计 量 称 为 Smimov 型 统计 量 ， 本 章 仅 考 虑 由 分 布 函数 间 的 垂直 方向 距离 决 
定 的 统计 量 ， 既 可 以 是 经 验 分 布 函数 ， 也 可 以 是 假设 的 分 布 函 数 . 


> Kolmogorov 拟 合 优 度 检 验 


数据 ”数据 包含 容量 为 n 的 随机 样本 XX, ,X,,…,X,， 它 来 自 于 某 个 未 知 分 布 F(x). 


假定 条 件 
1. 样本 是 随机 样本 . 
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检验 统计 量 S S(x) 是 基于 随机 样本 X, ,X ,…, 忆 的 经 验 分 布 函 数 ， 严 (x) 是 完全 
已 知 的 假设 分 布 函数 ， 对 于 下 列 3 个 不 同 的 检验 A,B,C， 检 验 统计 量 的 定义 也 有 所 
不 同 . 
A. (双边 检验 ) “” 设 检验 统计 量 了 为 S(x) SFORA ( 记 为 “sup”) 垂直 
距离 ， 用 式 子 表 达 如 下 : 
T = sup |E*(x) — S(x)| (1) 


它 读 为 “T 等 于 F* (x) - S(x) 的 绝对 值 对 所 有 实数 x 的 上 确 界 ”. 
B. (HURE) ” 记 这 个 检验 统计 量 为 7*， 它 等 于 F” (x) 位 于 5S(x) 上 方 它们 的 
最 大 生 直 距离 ， 也 就 是 : 
pra Sup [F*(x) — S(x)) (2) 


这 与 类似 ,但 要 注意 的 是 ， 这 里 我 们 只 考虑 F” (x) 位 于 S(x) 上 方 那 部 分 的 最 大 垂 
直 距 离 . 

C.( 单 边 检 验 )” 记 这 个 检验 统计 量 为 7 ， 它 定义 为 S (x) 位 于 F (x) 上 方 它 
们 的 最 大 垂直 距离 ， 也 就 是 : 


T- = sup {$0) — FP*0)] (3) 
Toh 设 F(x) 是 连续 的 且 零 假设 是 正确 的 ， 那么 T’ Ej T 的 精确 分 布 为 : 
ON jN ji-! 
G(x)=1—x 2 WO x i) [+ 1) (4) 


其 中 ，[n(1 -x) ] 是 小 于 或 等 于 n(1 -x) 的 最 大 整数 ， 且 7' 与 7 的 分 布 相同 .VnT* 
与 Vn7 的 浙 近 分 布 为 ( 当 n 一 % 时): 


H(x) = lim c( 亏 ) =1 — e> (5) 
Vn 


T BITATE RROA : 
P(T < x) = [G(x)]° (6) 

WH, HAM TE T 同时 小 于 x 时 , T 才 小 于 XX. 

n<40 时 ， 双 边 检 验 中 工 精确 的 分 位 数 以 及 单 边 检验 中 T, T ` 近似 的 分 位 数 在 
表 A13 中 给 出 ， 近 似 的 估计 用 于 n>40. 注意 ， 所 有 的 这 些 检验 都 只 是 右边 的 . “ 单 
边 ” 或 “双边 ”的 假设 根据 个 人 的 研究 兴趣 而 定 ， 检 验 统计 量 可 以 重新 定义 ， 使 得 
所 有 这 3 种 检验 都 是 右边 的 . 

X F(x) 连续 时 ， 表 Al3 是 精确 的 ， 否 则 ， 所 有 这 些 分 位 数 导致 一 个 保守 的 检验 
( Noether,1967a). 当 F(x) 为 离散 时 ， 例 6.1.1 将 描述 一 种 用 来 找 精确 零 分 布 的 
方法 . 
假设 

A.( 双边 检验 ) 
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Ho FO) = F*(x) 对 所 有 xE(-%%,+%) 

H: F(x) 关 F*(x) ”至少 对 某 个 x 
如 果 了 了 值 超过 了 表 AL 中 给 出 的 双边 检验 的 1 -a 分 位 数 ， 则 我 们 以 显著 水 平 a 拒绝 
H, W p- 值 可 以 通过 在 表 A13 中 插值 得 到 ， 或 者 利用 2 倍 的 单 边 检验 的 p- 值 


[n(1-t)J AV; \ j- 
单 边 p- 值 = t > (a - 1) (GAN (7) 


n 


这 里 的 上 是 检验 统计 量 的 观测 值 ， 且 [na(1 -1)]ÆEDNFEF n1 7?) 的 最 大 整数 . 
B. ( 单 边 检验 ) 
Hoa: F(x) > F*(x) 对 所 有 xe( 一 ,十 oo) 
Hi: F(x) 二 F*(x) 至少 对 某 个 x 
如 果 T' 值 超过 了 表 A13 中 给 出 的 单 边 检验 的 1 -a 分 位 数 ， 则 我 们 以 显著 水 平 a 拒 
绝 H,， 近 似 p- 值 可 以 通过 在 表 A13 中 插值 得 到 ， 精 确 的 p- 值 可 以 通过 (7) 式 算出 . 
C. ( 单 边 检验 ) 
Ho: F(x) < F*(x) 对 所 有 x e(-%,+ 0) 
Hi: F(x) > F*(x) 至 少 对 某 个 x 
如 果 三 值 超过 了 表 AL 中 给 出 的 单 边 检验 的 1 — a 分 位 数 ， 则 我 们 以 显著 水 平 a 拒绝 
H, 近似 p- 值 可 以 通过 在 表 A13 中 插值 得 到 ， 精 确 的 产值 可 以 通过 (7) 式 算 出 . 
计算 机 辅助 ”用 软件 S-Plus 和 StatXact 计算 Kolmogorov 拟 合 优 度 检验 ， —— a 
例 6. 1.1 
一 组 容量 为 10 的 样本 如 下 : X, =0. 621,X, =0.303 ,X =0.203,X, =0.477, X, =0.710, 
X, =0.581, X, =0. 329, X, =0.480, X, =0. 554 , X = 0. 382. 零 假 设 是 样本 服从 分 布 项 
数 为 均匀 分 布 函数 ， 它 的 图 像 如 图 6-3 所 示 ， 假设 的 均匀 分 布 孙 数 的 数学 表达 式 为 : 
F*(x)=0 若 x < Ü 
=x # 0O=<x<1 
= # 1<x (8) 
形式 上 ， 假 设 检验 给 出 如 下 : 
Ho: F(x) = F*(x) 对 所 有 x e(-%,+%) 
Hi: F(x) 关 F*(x) ”至 少 对 某 个 x 
这 里 ，F(x) 是 X 的 未 知 分 布 函数 ，F (x) 由 (8) 式 给 出 . 
F (x) 


1.0 t- 


| 
0.5 六 


全 一 二 一 一 车 一 
图 6-3 假设 的 分 布 函数 
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用 双边 Kolmogorov 拟 合 优 度 检验 ， 水 平 为 a =0.05 的 临界 域 对 应 着 了 值 大 于 
0.95 分 位 数 0.409 (由 表 A20 `4 n = 10 获得 )， 由 天 出 的 经 验 分 布 函 数 SCxz) 图 ， 见 
E 6-4, THEE SCx) 的 最 高 处 ( 即 x=0.710 处 ) 取得 ，5(x) 与 F”(x) 的 最 大 垂直 
距离 为 0.290， 其 中 ，5(0.710) =1.000 MF* (0.710) =0.710. 也 就 是 

T= sup IF*(x) 一 S(x)| 


= |F*(0.710) — S(0.710)| = 0.290 
因为 了 =0. 290， 它 小 于 0. 409， 所 以 接受 零 假 设 . 从 表 A13 可 看 出 ，P- 值 大 于 0.20， [433] 


图 6-4 带 有 7 值 的 (x) SO) KER 
如 果 我 们 想 检 验 零 假设 
Ho: F(x) > F*(x) ”对 所 有 的 x 
对 单 边 备 择 假设 
Hi: F(x) < F*(x) 对 于 某 个 x 
对 此 ， 我 们 用 检验 统计 量 T” ， 判 决 法 则 为 :对 于 单 边 检验 ， 如 果 T' 超过 0.95 分 位 
数 ，0. 369 (由 表 Al3 当 n=10 获得 ) ， 则 我 们 以 a =0. 05 的 置信 水 平 拒绝 Ho， 在 这 
种 情况 下 ， 可 以 计算 7’ 的 值 ， 它 在 S(x) 左 边 的 第 2 个 跳跃 点 处 取得 . 
+= sup [F*(x) — S(x)] = F*(0.3289) — S(0.3289) 
= 0.3289 — 0.100 = 0.2289 


更 确切 地 说 ，T* =0. 228999…， 大 约 为 0.229， 最 后 的 结果 是 相同 的 ，p- 值 0.10. 

对 另 一 个 方向 的 单 边 假设 检验 ， 结 果 为 

T- = sup [S(x) — F*(x)] = S(0.710) — F*(0.710) 
= 1.000 — 0.710 = 0.290 

P- 值 >0. 10. 

对 这 种 情形 ， 双 边 检验 是 合适 的 检验 ， 这 里 用 单 边 检 验 ， 只 是 为 了 说 明 如 何 来 
估算 检验 统计 量 ， 一 般 来 说 ， 双 边 检 验 统计 量 了 总 等 于 单 边 检 验 统计 量 T' 和 六 中 
较 大 的 一 个 . 


[435] 
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双边 检验 中 更 精确 的 p- 值 ， 可 以 通过 (7) 式 中 给 出 的 p- 值 的 2 倍 来 计算 . 


A 
-1HE = , e L, = 29 += 
p- 值 2029 Š [° 021: a 0.29 + ~ 
= 2(0.29)(0.112 + 0.117 + 0.101 + 0.081 + 0.061 + 0.040 + 0.017 + 0.000) 


= 2(0.29)(0.530) 
= 0.307 m 


F* (x) 为 离散 时 ， 一 种 计算 精确 p- 值 的 方法 


如 果 所 假设 的 分 布 F* (x) 为 离散 的 ， 且 从 表 AL 中 得 到 的 p- 值 不 令 人 满意 ， 那 
么 精确 的 p- 值 可 以 通过 一 个 特殊 的 检验 统计 量 观 测 值 获得 .， 若 样本 量 少 于 等 于 5,， 计 
算 过 程 可 以 用 手 算 来 完成 ， 若 样本 量 较 大 ， 我 们 推荐 用 计算 机 程序 ， 如 StatXact Xit 
算 ， 其 方法 由 下 面 给 出 ， 对 于 离散 型 分 布 ，P- 值 通常 是 由 表 Al13 所 得 到 近似 p- 值 的 
1⁄3. 下面 的 每 一 节 对 应 于 前 面 给 出 的 3 种 假设 检验 A,B 和 C. 
A.( 双 边 检验 ) 设 :为 检验 统计 量 7 的 观测 值 ， 接 下 来 的 B 和 C 部 分 ， 用 上 代 
Ë 1* 和 + 也 一 样 计算 P(T 三 1) 和 P(T =t). 那么 
P(T >t) = P(T* >p) + P(T- 2t) (9) 
在 大 部 分 情况 下 ， 它 是 非常 接近 于 真实 p- 值 的 一 个 近似 ， 除 非 上 值 很 小 时 ， 它 的 值 可 
能 比 真实 的 p- 值 大 . 
B. ( 单 边 检验 ) Wt 为 T' 的 观测 值 . 
第 1 步 : 通过 直接 在 F (x) 的 图 像 上 而 一 条 纵 坐 标 为 1 -1  -j/n 的 水 平 线 来 计 
算 概率 f(0<j<n(1 -t)), WEF =1-t - j/n, 除非 这 条 水 平 线 与 F”(x) 的 一 个 
跳 路 相交， 在 这 种 相交 的 情况 下 ，f 等 于 相交 处 F” (x) 阶 梯 底 部 的 高 度 值 . 
第 2 步 : 通过 递归 关系 es =1， 且 
e,=1- y (i) k21 (10) 
HAPT = 
来 计算 常数 e ,e, ,…， 对 于 所 有 大 ， 使 得 第 1 步 中 的 所 >0， 且 注意 ， 这 些 常 数 有 如 下 
形式 : 


en 三 1 
El = 1 -fo 
e> = 1 一 了 sssi 2f.e, 


e = 1 — f — 3f e, —- 3fe, 
e = 1 -— f — 4f?e, — 6fre, — 4fe 
es = 1 — fe — 5fife, — 10f2e, — 10 有 es — 5fé, 
等 . 
第 3 步 : 计算 精确 的 单 边 p- 值 
lad / V 
PT 2t)= > (©) fiie, (11) 


j=0 
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其 中 , f, e 为 第 1， 第 2 步 中 所 得 到 的 . 

C. (HARE) WEA T 的 观测 值 . 

第 1 步 : RR (O0<;j<n(1-í )) 如 下 ， 在 F”(x) 的 图 像 上 ，、 曾 一 条 纵 坐标 
为 1 +j/n 的 水 平 线 ， 则 cj; =1 -1 - j/n， 除 非 这 条 水 平 线 与 F” (x) 的 一 个 跳跃 相 
交 ， 在 这 种 相交 的 情况 下 ，c, 等 于 1 减 去 相交 处 F” (x) 阶 梯 顶 部 的 高 度 值 . 

第 2 步 : 通过 递归 关系 b,=1, H 

b;:=1 - > (5) c-b; k>1 (12) 
oV 
来 计算 常数 b, ,b,,…， 对 于 所 有 上 ， 使 得 第 1 步 中 的 >0. AERAR B 部 分 的 e, 
有 相同 的 形式 ， 只 需 用 c 替代 万 即 可 . 
第 3 步 : 计算 精确 的 单 边 p- 值 
P(T >! )- 2 ' (r)en, (13) 
Hp c, b 为 第 1, 第 2 步 所 得 到 的 . 
下 面 的 例子 将 说 明 ， 当 F”* (x) 为 离散 时 ， 如 何 用 这 种 方法 来 计算 精确 的 p- 值 . 
例 6. 1.2 
AF* (x) 为 离散 的 均匀 分 布 ， 在 x=1，2,， 3, 4, 5 有 相同 的 概率 1/5， 设 有 一 组 样 
本 容量 为 10 的 抽 自 某 个 总 体 的 随机 样本 {排序 ) 如 下 : 1, 1, 1, 2, 2, 2, 3, 3, 
3, 3. 而 零 假设 为 F"(x) 就 是 这 个 总 体 的 分 布 函 数 ， 而 F” (x) 与 5(x) 的 最 大 距离 出 
现在 x=3 处 (如 图 6-5)， 那么 双边 Kolmogorov 检验 统计 量 为 
T= sup IF*(x) — S(x)| = 0.4 = t (14) 


为 了 计算 上 =0.4 时 的 p- 值 ， 首 先 我 们 计算 P(T’ 二 0.4) 的 概率 . 
第 1 步 : 因为 n(1 - =10(0.6) =6， 所 以 需 用 计算 fh 到， 纵 坐 标 为 1 -t=0.6 
的 水 平 线 与 F* (x) 在 跳跃 点 x=3 处 相交 ， 所 以 有 等 于 水 平 线 的 纵 坐 标 , f, =0.6， 对 于 
j=1， 水 平 线 1 -+t-1/10 =0.5 与 F* (x) 的 一 个 跳跃 相交 ， 所 以 f. 等 于 相交 处 F”(x) 阶 
梯 底 部 的 高 度 值 ， 即 : f =0.4， 同 样 地 , f, =0.4, 户 =0.2, f=0.2, f=0. 
Lo. 


0.6} 


6-5 带 有 了 值 的 F”(x) 与 S(x) 的 图 像 


438 
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第 2 步 : 从 (10) 式 可 递归 计算 常数 e, 到 e4: 
@ = 
e, = 1 — 0.6 = 0.4 
e, = 1 — (0.6) ~ 2(0.4)(0.4) = 0.32 
e, = 1 — (0.6} — 3(0.4}(0.4} — 3(0.4)(0.32) = 0.208 
e, = 1 — (0.6)* — 4(0.4)'(0.4) — 6(0.4)*(0.32) 一 4(0.2)(0.208) = 0.2944 


第 3 步 : 利用 (11) R, 计算 单 边 p- 值 P(T ° >) 
P(T' > D) = f + l.) fi + 2) fe, + |) le (1P) fes = 0.021 


因为 F(x) 是 对 称 的 ， 计 算 另 一 边 的 单 边 p- 值 P(T >0.4) 与 前 面 的 过 程 相 同 ， 氛 
以 P(T  >0.4) =0.21， 且 双边 p- 值 近似 为 : 

P(T > 0.4) = 2(0.021) = 0.042 
有 趣 的 是 ， 注 意 到 这 个 产值 表明 在 a = 0.05 的 水 平 下 ,正确 的 判决 是 拒绝 零 假 设 ， 
而 用 表 Al13 将 导致 在 同样 的 水 平 w 下 ， 错 误 地 接受 天 (x) 为 正确 的 分 布 图 数 . E 


Kolmogorov 双边 检验 一 个 最 有 用 的 特征 是 ， 它 的 1 -a 分 位 数 w,_。 可 以 用 来 为 
真实 未 知 的 分 布 函 数 构造 一 个 置信 界 ， 回 忆 一 下 ,我 们 在 为 某 个 未 知 参数 寻找 置信 
区 间 时 ， 首 先 抽出 一 组 随机 样本 ， 然 后 从 这 组 随机 样本 中 计算 一 个 上 界 值 U 和 一 个 
下 界 值 L， 使 得 它 以 1 -a 的 概率 包含 这 个 未 知 参数 ， 并 把 1 - a 称 为 置信 系数 ， 这 里 
一 个 方便 的 做 法 是 ， 如 果 我 们 能 够 对 完全 未 知 的 分 布 隔 数 做 同样 的 事情 来 获得 一 个 
“置信 和 界 ”， 使 得 完全 未 知 的 分 布 函数 以 1 -a 的 概率 落 在 这 一 置信 界 内 ， 然 后 我 们 可 
以 从 某 个 完全 未 知 的 分 布 总 体 中 抽取 样本 ， 并 且 能 为 其 图 像 设 定 一 个 界 ， 说 明 这 个 
未 知 的 分 布 函数 以 1 -a 的 概率 正确 地 落 在 这 个 界 内 . 


> 总 体 分 布 函数 的 置信 和 界 


数据 ”数据 包括 容量 为 n 的 ， 且 来 自 于 某 个 总 体 的 随机 样本 X ,X,,…,X,， 总 体 的 未 
知 分 布 晒 数 记 为 F(x). 
假定 条 件 

1. 样本 是 随机 样本 . 

2. 为 了 置信 系数 的 精确 ， 随 机 变量 应 当 是 连续 的 .如果 随机 变量 是 离散 的 ， 那 
么 这 个 置信 界 是 保守 的 ， 也 就 是 说 未 知 真实 的 置信 系数 大 于 我 们 所 给 的 . 
方法 “” 画 一 个 随机 样本 的 经 验 分 布 函 数 S(z) 图 ， 为 了 构造 置信 系数 为 1-a BJ “E 
信 界 " ， 我 们 可 以 从 表 A13 中 查 到 双边 检验 ( 如 果 想 要 构造 双边 置信 和 界 )， 及 合适 的 
样本 容量 为 n 时 Kolmogorov 检验 统计 量 的 1 - a 分 位 数 . 用 zi 。 记 此 分 位 数 ， 在 
S(x) 的 上 方 距离 为 z ,处 画 一 图 像 ， 称 为 U(x)， 在 S(x) 的 下 方 距 离 为 w, 。 处 画 第 
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2 个 图 像 ， 称 为 L(x)， 于 是 U(x) 与 (x) 就 分 别 形成 了 上 、 下 界 ， 使 得 完全 未 知 的 


分 布 盟 数 F(x) 以 1 - a 的 置信 水 平 落 在 这 个 界 内 . 

注意 ，V(z) 的 图 像 不 能 超过 1.0， 即 使 S(x) + zw -。 可 能 超过 1.0， 因 为 我 们 知 
道 分 布 函数 的 值 不 可 能 超过 1.0， 同 样 的 原因 ，Z(zx) 的 值 不 能 低 于 横 轴 的 值 ，V(x) 
与 L( x) 的 数学 表达 式 如 下 


U(x) = S(x) ta Æ 500+z 委 1 

U(x) = 1.0 车 S(x) +tuy-,>1 (15) 

L(x)=S(x) 一 Wi-。 车 S(xz) — w-a>0 

L(x) = 0 若 S(x) — Wi-a < Ü (16) 
用 概率 的 语言 表达 为 : 

P[L(x) = F(x) =< U(x), 对 所 有 的 Xx] Z 1 — = (17) 
其 中 ， 最 后 一 个 不 等 号 只 有 当 随 机 变量 为 离散 时 成 立 . 
例 6.1.3 


假设 我 们 要 为 未 知 分 布 函 数 构造 一 个 90% 的 置信 和 界 ， 一 组 容量 为 20 的 随机 样本 抽 
自 这 个 总 体 ， 结 果 按 从 大 到 小 排列 如 下 : 
16.7 174 181 18.2 18.8 193 224 224 240 247 
25.7 270 351 358 365 36 38 421 432 462 


10: 


U(v) = Six) + 0.265 
ER 


0.5 - 


FR 
Lx) = Sl) - 0.265 


图 6-6 F (x) 的 置信 界 
从 表 Al13 可 知 ， 当 n=20 Bf, 0.90 分 位 数 wow =0. 265. 这 个 置信 界 就 是 S(x) + 
0. 265， 只 要 界 位 于 0 与 1 之 间 . 图 6-6 mH f S(x), U(x) 和 L(x)， 结 论 “F(x) 
完全 界 于 U(x) 与 L(x) 之 间 ” 成 立 的 概率 为 0. 90. m 
Kolmogorov 统计 量 的 分 布 的 推导 很 复杂 ， 这 里 我 们 没有 写 出 ， 有 兴趣 的 读者 可 
以 参考 以 下 有 关 这 方面 的 一 些 基 本 论文 . 
双边 检验 统计 量 T 的 渐 近 分 布 是 由 Kolmogorov ( 1933) 发 现 的 ， 并 由 Smirnov 
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(1948) 制 成 表格 形式 ， 单 边 检 验 统 计量 T' A T 的 渐 近 分 布 是 Smirnov (1939 ) 获得 
的 ， 对 于 有 限 (小 ) 样本 的 检验 统计 量 的 精确 分 布 ， Wald 和 Wolfowitz(1939 ) 进行 过 
研究 ， 并 由 Massey (1950a) 制 成 表格 . T 的 有 限 样 本 分 布 函数 由 Bimbaum 和 Tingey 
(1951) 推 导出 ， 并 把 从 他 们 的 精确 分 布 获 得 的 精确 分 位 数 与 Smirov( 1939 ,1948 ) 给 
出 的 渐 近 分 位 数 做 了 比较 ， 发 现 用 渐 近 的 分 位 数 将 导致 保守 的 检验 . 

只 要 F(x) 与 F*(x) 有 差异 ， 双 边 Kolmogorov 检验 就 有 一 致 拒绝 的 良好 性 质 ， 其 
中 F(x) 为 真实 的 分 布 ， F(x) 为 假设 分 布 ， 然 而 ,对 于 有 限 样本 来 说 ,， 它 是 有 偏 的 
( Massey ,1950b). Massey( 1950b) 还 给 出 了 双边 检验 功效 的 一 个 下 界 ， 而 在 某 些 特定 
的 备 择 假 设 下 ，Birmbaum(1953 ) 给 出 了 功效 的 下 确 界 ， 在 另 一 类 不 同 的 备 择 假设 下 ， 
Lee(1966 ) 给 出 了 功效 的 另 一 个 下 确 界 . 

Van der Waerden( 1953) , Suzuki( 1968), Shapiro, Wilk 和 Chen( 1968 ) 以 及 Knott 
(1970) 对 功效 作 了 其 他 的 比较 . 关于 Kolmogorov 检验 及 其 类 似 的 拟 合 优 度 检验 问题 
的 文章 可 见 Finkelstein 和 Schafer( 1971 ) , Maag 和 Dicaire ( 1971), Carnal 和 Riedwyl 
(1972) 以 及 Stephens( 1974). Barr 和 Davidson( 1973 ) , Pettitt 和 Stephens( 1976) 在 对 截 
尾数 据 的 情况 下 ， 对 检验 提出 了 修改 ， 而 Bar 和 Shudde(1973 ) 讨 论 了 对 圆周 上 观测 
数据 检验 的 修改 .Govindarajulu 和 Klotz( 1973) 对 渐 近 分 布 作 了 注解 ， 关 于 估计 与 检 
验 对 称 分 布 为 主题 的 文章 参见 Schuster 和 Narvarte(1973 ) ,Schuster( 1973 ) 以 及 Sirniva- 
san 和 Godio( 1974). 

对 于 在 离散 型 分 布 情形 下 的 修正 则 由 Conover( 1972 ) 与 Coberly 和 Lewis ( 1973) 
独立 提出 的 . 关于 这 种 情形 下 更 深入 的 分 析 ， 可 参见 Horn 和 Pyne (1976 ) , Horn 
(1977), Bartels, Horn, Liebetrau 和 Harris( 1977 ) 与 Pettitt 和 Stephens ( 1977 ) 的 文章 ， 
同样 他 们 还 制作 了 一 些 表 格 . Maag, Streit 和 Drouilly( 1973) 讨论 了 分 组 数据 的 拟 合 优 
度 检验 . Wood 和 Altavela( 1978) 建议 对 大 样本 采用 模拟 的 方法 . 

另外 一 种 拟 合 优 度 检验 就 是 Cramér-von Mises 检验 ， 由 Cramér( 1928), Van Mi- 
ses( 1931) 与 Simrnov(1936 ) 发 展 起 来 的 ， 尽 管 相 对 于 Kolmogorov 检验 ， 对 于 许多 人 
来 说 它 更 有 直观 性 ， 但 是 这 两 种 检验 并 没有 太 大 的 区 别 ， 我 们 这 里 不 做 详细 讨论 . 
有 兴趣 的 读者 ， 可 以 查看 Anderson 和 Darling ( 1952 ) 给 出 的 Cramér-von Mises 检验 的 
渐 近 分 布 ，Stephens 和 Maag( 1968) 给 出 了 有 限 样本 的 精确 表格 ， 较 早 地 对 这 种 检验 
与 Kolmogorov 检验 进行 研究 的 有 Stephens ( 1964, 1965a ) Tiku ( 1965), Suzuki 
(1967), Cronholm(1958) 与 Noé 和 Vanderwiele( 1968 ). Walsh ( 1960 ,1963 ) 讨论 了 这 
两 种 检验 的 离散 ( 结 ) 效应 ，Thompson(1966) 考查 了 Cramér-vonMises 检验 的 偏差 
与 功效 ，Gelzer 和 Pyke( 1965) ,Quade(1965 ) 以 及 Abrahamson( 1967) 研究 了 Kolmog- 
orov 检验 的 相对 效率 . 

关于 样本 密度 的 拟 合 优 度 检验 问题 ，Woodroofe(1967 ) 提出 并 进行 了 讨论 ，Ste- 
phens(1967) 对 圆周 上 观测 的 情况 进行 了 讨论 ，Riedwyl( 1967) 对 一 般 情况 进行 了 讨 
论 ，Durbin(1968) 介 绍 了 一 种 不 同类 型 的 分 布 函 数 的 置信 区 间 . 
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习题 


Il. 从 一 个 四 年 级 班 上 随机 抽出 5 名 学 生 进 行 计时 短跑 ， 他 们 的 时 间 (E) 分 别 为 6.3,4.2， 
4.7, 6.0 和 5.7. 用 画图 或 列表 格 的 形式 给 出 这 个 四 年 级 班 所 有 学 生 短跑 时 间 分 布 浮 数 的 
90% 置信 界 . 

乡村 的 杂货 店 从 近邻 农家 收取 鸡蛋 时 ， 需 要 在 灯光 前 检查 鸡蛋 是 否 新 鲜 ， 现 有 8 箱 鸡 蛋 ， 
每 箱 有 144 个 ， 经 检查 每 箱 中 被 拒 收 的 鸡蛋 个 数 为 : 4,0,2,0,2,0,2,0， 试用 画图 或 列表 
格 的 形式 给 出 所 有 收取 鸡蛋 的 总 体 中 被 拒绝 鸡蛋 的 个 数 分 布 郧 数 的 95% 置信 界 . 

3. 对 于 习题 1 中 给 出 的 数据 ， 检 验 其 是 否 服从 4 到 8 秒 间 的 均匀 分 布 . 注意 ， 这 个 分 布 珊 


tƏ 


数 为 
F*(x) = O 对 x<4 
= (x — 4) / 4 对 4<x<8 
=1 对 8<x 


4. 以 前 的 记录 表明 每 箱 中 被 拒绝 鸡蛋 的 个 数 服 从 均值 为 1.5 的 Possion 分 布 ， 对 于 习题 2 中 
的 数据 检验 其 是 否 来 自 这 样 的 分 布 . 注意 ,均值 为 1.5 的 Possion 分 布 有 如 下 概率 : 
P(0) =0.223,P(1) =0.335,P(2) =0.251,P(3) =0.126,P(4) =0.047,P(5) =0.014, 
P(6) =0. 004. 

5. ”奥运 会 跳水 比赛 要 用 10 次 跳水 来 评定 成 绩 ， 其 10 次 成 绩 为 : 1.7,5.3,7.6,8.9,9.0,9.1, 
9. 3,9.6,9.9,9.9， 检 验 其 是 否 服 从 如 下 的 分 布 F(x), 其 中 


F(x) = 0 #x < 0 
F(x) = x?/100 #0<x<10 
F(x)=1 10 < x 


6. 通过 上 一 年 对 数 千 辆 汽车 排放 的 氨 氧 化 物 的 测量 ， 发 现 它 大 约 服从 均值 为 5.6， 标 准 差 为 
1.2 的 正 态 分 布 模型 ， 今 年 测量 的 12 辆 汽车 的 排放 量 为 : 
4.8, 6.2, 6.0, 5.9, 6.6, 5.5, 5.8, 5.9, 6.3, 6.6, 6.2, 5.0 
问 今年 汽车 排放 量 的 分 布 模型 是 否 与 去 年 的 相同 ? 


思考 题 


证 明 (17) 式 中 的 置信 界 是 有 效 的 ， 即 证 明 : WR o, _。 是 Kolmogorov 统计 量 的 1 -a 分 位 
数 ， 则 (17) 式 成 立 . 


6.2 分 布 族 的 拟 合 优 度 检验 


6. 1 节 中 我 们 讲述 的 Kolmogorov 拟 合 优 度 检验 ， 是 用 来 检查 一 个 样本 是 否 符合 某 
个 特定 分 布 的 一 种 很 好 的 检验 方法 .Kolmogorov 检验 只 有 当 假设 的 分 布 完全 已 知 的 时 
候 才 适用 ， 也 就 是 说 ， 假 设 的 分 布 不 包含 需要 从 样本 里 估计 的 未 知 参数 ， 否 则 ， 检 验 就 
变 得 保守 了 .而 x 拟 合 优 度 检验 则 比较 灵活 ， 人 允许 分 布 中 包含 有 需要 从 数据 中 符 估 的 
未 知 参数 ， 正 如 前 面 所 描述 的 ， 用 “最 小 x 估计 ”估计 每 一 个 参数 ， 则 自由 度 需 要 减 
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去 一 个 ， 然 而 , x 检验 要 求 数据 必须 分 组 ， 而 这 种 分 组 又 通常 是 随意 的 同时， 检验 
统计 量 的 分 布 只 是 近似 的 ， 且 有 时 x 检验 的 功效 也 不 高 ， 由 于 这 些 原因 ， 我们 想 寻 找 别 
的 拟 合 优 度 检验 ， 特 别 是 对 一 些 经 常 需要 检验 的 分 布 . 

Kolmogorov 检验 适当 修改 后 也 能 适合 许多 包含 待 估 参数 的 情况 .实际 上 ， 检 验 
统计 量 并 未 改变 ， 只 是 用 到 的 临界 值 表 有 变化 ， 对 于 所 有 的 分 布 ， 这 些 表 不 再 是 用 
同样 一 些 表 ， 它 随 着 不 同 的 假设 分 布 而 变化 . 这 种 检验 仍然 是 非 参 数 的 ， 因 为 这 个 
检验 的 有 效 性 (a 水 平 ) 不 依赖 于 关于 总 体 分 布 未 检验 的 具体 假设 条 件 ， 而 检验 的 
是 总 体 的 分 布 形式 假设 . 

Kolmogorov 检验 最 先 的 修改 用 于 检验 复合 正 态 分 布 的 假设 ， 也 就 是 说 ， 零 假设 
只 是 说 明 总 体 来 自 正 态 分 布 族 ， 但 是 未 指明 正 态 分 布 的 均值 与 方差 ，Lilliefors( 1967 ) 
最 早 提出 了 这 种 检验 .对 这 个 检验 有 意思 的 一 点 是 ， 为 了 获得 检验 统计 量 精确 分 布 
的 真实 分 位 数 的 精确 估计 ， 一 个 最 早 的 方法 就 是 采用 计算 机 生成 随机 数 的 方法 . 


p Lilliefors 正 态 性 检验 


数据 ”数据 包含 来 自 某 个 未 知 分 布 的 个 随机 样本 X. ,2 , ,和 ， 未 知 分 布 的 分 布 函 
GCA Fa). 计算 样本 均值 
X, (1) 


作为 的 一 个 估计 ; 计算 


s= /> 2) 
i=l 
作为 er 的 一 个 估计 ， 然 后 计算 “标准 化 ”后 的 样本 值 Z,， 它 定义 为 
X-X . 
ma T E” (3) 


检验 统计 量 是 在 原 检 验 统计 量 中 用 Z, 替代 原始 随机 样本 而 得 到 . 
假定 条 件 

1. 样本 是 随机 样本 . 
检验 统计 量 通常 情况 下 ,检验 统计 量 是 双边 Kolmogorov 检验 统计 量 ， 定义 为 X, 的 
经 验 分 布 函 数 与 均值 为 了 ， 标准 差 为 s 的 正 态 分 布 的 最 大 垂直 距离 ， 其 中 X，s 由 
(1) ,(2) 式 给 定 ， 然 而 ， 下 面 计 算 检 验 统计 量 的 方法 稍微 容易 一 些 ， 且 与 我 们 上 面 所 
提 到 的 方法 是 等 价 的 . 

画 一 个 标准 正 态 分 布 函 数 的 图 像 ， 记 为 F* (x). 实际 上 ， 我 们 只 需要 F” (x) 在 观 
测 点 Z 处 的 值 ， 这 时 表 Al 可 能 起 到 作用 .同样 我 们 画 一 个 “标准 化 ”样本 Z, 的 经 
验 分 布 函数 的 图 像 ，Z 的 定义 见 (3) 式 , 记 5(x) 为 其 经 验 分 布 函数 ， 与 F” (x) 用 同 
一 个 坐标 系 ， 找 出 F*(x) 与 5S(x) 的 最 大 垂直 距离 ， 这 个 距离 就 是 检验 统计 量 .， 也 就 
是 说 ，Lilliefors 检验 统计 量 T, 定义 如 下 : 
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Ti = sup |F*(x) = sO) (4) 


T, 与 Kolmogorov RIEA EAIA LATEEF (4) sÇ rh H002e 59 a P8 3 8 H REE 
的 样本 得 来 的 ， 而 Kolmogorov 检验 则 是 基于 原始 观测 样本 . 
零 分 布 ”在 计算 机 上 产生 几 千 个 伪 随 机 数 来 近似 获得 零 分 布 ， 并且 通 过 数 干 个 检验 
统计 量 的 值 作出 的 经 验 分 布 函 数 来 估计 分 位 数 . 表 Al14 中 给 出 了 这 些 分 位 数 的 估计 ， 
精确 的 分 位 数 及 精确 的 零 分 布 的 数学 形式 仍然 未 知 . 
假设 

Ho: 样本 来 自 于 一 个 未 知 均值 和 标准 差 的 正 态 分 布 总 体 

Hi: Xi 的 分 布 函数 不 是 正 态 分 布 


HU T 超过 了 表 Al14 中 给 出 的 1 - a 分 位 数 ， 则 我 们 以 近似 置信 水 平 a 拒绝 H. 

P- 值 可 以 通过 表 Al4 中 的 分 位 数 近似 求 得 . 

计算 机 辅助 ”Lilliefors 正 态 性 检验 可 以 在 Minitab ,S-Plus ,及 StatXact 中 进行 计算 . — 4 
例 6. 2.1 

在 4.5.3 节 中 ,我 们 用 实例 来 解释 x 正 态 性 检验 ， 现 在 我 们 用 同样 的 数据 来 说 明 
Lilliefors 检验 ， 从 电话 本 里 随机 抽取 50 个 2 位 数 ， 显 然 随机 变量 的 样本 是 离散 的 ， 
尽管 如 此 ， 我 们 依然 用 它 作 正 态 性 检验 ， 只 要 我 们 注意 到 接受 正 态 性 的 零 假设 并 不 
意味 着 随机 变量 就 是 正 态 的 ， 因 而 是 连续 的 ， 而 仅仅 表明 正 态 分 布 蝎 数 与 它 实际 分 
布 函数 的 差别 不 显著 ， 以 至 于 不 能 检测 出 来 . 

将 X 从 小 到 大 排列 ， 并 且 从 (1) 和 (2) 式 中 分 别 减 去 X=S5.04， 除 以 *= 19. 00， 
这 时 X, 转化 为 Z, WFK: 


X, Z; X; Z, X; Zi X, Z, X, Z, 

23 1.69 36 —1.00 54 — 0.05 61 0.31 73 0.95 
23 —1.69 37 一 0.95 54 一 出 的 61 0.31 73 0.95 
24 —1.63 40 — 0.79 56 0.05 62 0.37 74 1.00 
27 一 1.48 42 一 0.69 57 0.10 63 0.42 75 1.05 
29 — 1.37 43 — 0.63 57 0.10 64 0.47 77 1.16 
31 = 1:27 43 —0.63 58 0.16 65 0.52 81 1.37 
32 —1.21 44 —0.58 58 0.16 66 0.58 87 1.68 


33 一 1.16 45 一 0.53 58 0.16 68 0.68 89 1.79 
33 —1.16 48 —0.37 58 0.16 68 0.68 93 2.00 
35 一 1.05 48 一 0.37 59 0.21 70 0.79 97 2.21 


用 Lilliefors 检验 统计 量 进行 正 态 性 的 零 假 设 检 验 ， 
Tı = sup |F *(x) — S(x)| 


其 中 ，F* (x) 是 标准 正 态 分 布 函 数 ，5(x) 是 Z, 的 经 验 分 布 函 数 ， 如 图 6-7， 画 出 了 
F*(x) 与 $S(x) 的 图 像 ， 在 图 6-7 中 我 们 可 以 看 到 ，F* (x) 与 S(x) 之 间 的 最 大 垂直 距 
离 出 现在 x = - 0.05 的 左 端 此 时 F* (x) =0.48, S(x) =0.40， 故 了 = 0.08. 
但 是 两 条 曲线 的 垂直 距离 等 于 0. 08 还 出 现在 其 他 点 上 ,如 x = +0.05 与 x=0. 10. 但 是 


[aas] 
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没有 点 使 两 条 曲线 的 距离 超过 0. 08. 


F*(-0.05) = 0.48 ——23 


= j 
! 
N 


x = -0.05 
图 6-7 F*(x) 与 $S(x) 的 图 像 及 其 它们 之 间 的 最 大 距离 
Lilliefors 正 态 性 检验 的 检验 法 则 是 : 如 果 T 超过 0.95 分 位 数 ， 则 我 们 以 a = 
0.05 水 平 拒绝 H, ER A14 中 给 出 的 0.95 分 位 数 为 
Wogs = ia s= kasan 
Vn v50 
由 于 Ti =0.08， 且 小 于 0.125， 所 以 接受 零 假设 ， 实际 上 , Æ a=0.20 的 水 平 上 ， 
也 可 以 接受 零 假 设 ， 因 为 0.8 分 位 数 等 于 0.104. 又 由 于 表 Al 中 未 给 出 更 小 的 分 
位 数 ， 所 以 我 们 断言 p- 值 一 定 是 某 个 大 于 0. 20 的 数 ， 这 与 我 们 在 x 检验 中 得 出 的 
结论 相同 . 
接受 零 假 设 并 不 意味 着 母体 是 正 态 的 ， 但 它 表 明正 态 分 布 不 失 为 其 真实 未 知 分 
布 的 一 个 合理 的 近似 ， 因 此 对 于 这 组 数据 ,不 管 是 非 参数 的 方法 ， 还 是 参数 的 方法 
! 都 表明 正 态 性 母体 假设 是 合适 的 . W 
口 理论 我们 讨论 Lilliefors 检验 的 一 个 主要 原因 是 ， 说 明 如 何 得 到 表 A14 中 的 分 位 
数 . 寻求 T, 的 分 布 使 得 Kolmogorov 检验 可 以 用 来 检验 均值 方差 未 知 的 复合 正 态 性 假 
设 是 很 困难 的 问题 ， 它 没有 解析 表达 式 ， 因此，Lilliefors 用 计算 机 和 随机 数 找到 了 近 
似 解 ， 下面 描述 的 同样 方法 可 以 为 大 多 数 的 统计 推断 问题 找到 近似 解 . 
回忆 一 下 ， 为 了 作 统 计 假 设 检验 ， 首 先 必须 找到 一 个 合理 的 检验 统计 量 ， 作 为 
表明 零 假设 正确 与 否 的 敏感 标识 ，T, 就 满足 这 种 要 求 ， 其 次 ,还 必须 选 定 某 个 特定 
的 区 域 作为 对 应 的 临界 域 ， 也 就 是 车 H, 是 正确 的 ， 临 界 域 中 的 值 不 太 可 能 出 现 ; 但 
若 H, 是 错误 的 ， 那么 临界 域 中 的 值 出 现 的 可 能 性 较 大 ， 较 大 的 T, 值 满足 这 个 要 求 . 
RE, Ra ( 即 当 H, 为 真 时 ， 点 出 现在 临界 域 中 的 概率 ) 是 比较 困难 的 .为 了 找 
a 值 ，Lilliefors 在 高 速 计算 机 上 产生 随机 正 态 离 差 (5. 10 节 中 提 到 ) ， 它 是 一 些 看 似 
像 独 立 标准 正 态 随机 变量 观测 值 的 随机 数 . 
把 这 些 随 机 数 分 组 ， 样 本 容量 为 n 分 为 一 组 ，n 可 以 是 随意 的 .比如 ，n =8, 从 


= 0.125 
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一 个 标准 正 态 分 布 中 产生 一 个 容量 为 8 的 样本 ， 由 于 是 计算 机 产生 ， 所 以 认为 H, 是 
正确 的 .计算 样本 均值 X， 并 把 它 减 去 ， 结 果 再 除 以 由 (2) 式 算出 的 *， 最 后 得 到 2Z 
的 值 . 将 基于 这 些 Z 的 经 验 分 布 水 数 与 标准 正 态 分 布 函 数 比较 ， 并 记录 下 它们 之 间 
最 大 垂直 距离 T,， 对 于 另外 一 组 8 个 数据 重复 上 述 过 程 ， 得 到 的 另 一 个 7 的 值 ， 最 
H, EH 为 真 的 情况 下 ， 得 到 超过 1000 组 (每 组 样本 容量 为 8) 的 样本 以 及 超过 
1000 个 的 TT 值 ， 基 于 这 1000 个 或 更 多 的 也 值 的 经 验 分布 也 数 ， 可 以 作为 T RAK 
际 分 布 的 一 个 近似 ， 从 这 个 经 验 分 布 函 数 中 ， 我 们 得 到 如 表 A14 中 n=8 时 所 给 的 分 
位 数 ， 这 样 ， 对 于 某 些 a， 就 能 得 到 近似 水 平 为 a 的 临界 域 . 

对 于 n=4 到 n=30， 我们 可 以 重复 上 述 过 程 ， 为 了 得 到 n 大 于 30 时 Lilliefors 所 
提出 的 近似 ， 壁 如 n=40， 分 位 数 还 是 由 上 面 的 方法 给 出 ， 并 乘 以 V40 后 得 到 表 中 的 
数据 ， 这 个 方法 是 基于 一 个 未 被 证 明 的 猜想 (在 当时 ) : T, 趋 于 它 的 渐 近 分 布 的 速度 
与 Klomogorov 统计 量 趋 于 其 极限 分 布 的 速度 一 致 ， 即 Yn 的 速度 . 

后 来 ， 为 了 获得 更 准确 的 分 位 数 估计 ，Mason 和 Bell(1986) 用 n =20 000 进行 了 
模拟 ， 结 果 列 在 表 Al14 中 . 

Lilliefors( 1967 ) 还 比较 了 他 的 检验 功效 与 x 检验 的 功效 ， 发 现在 一 些 非 正 态 的 
情况 下 ， 他 的 检验 功效 更 高 . 口 

Srinivasan 和 Wharton(1973) 得 到 了 参数 形式 下 的 正 态 分 布 的 一 个 参数 置信 和 界 . 
其 他 相关 的 论文 有 Srinivasan(1972) 及 Dyer( 1974). Teichroew( 1965) 给 出 了 模拟 及 其 
模拟 的 时 间 的 一 般 讨 论 . 

Lilliefors 对 Kolmogorov 检验 的 另 一 个 改进 是 在 1969 年 ， 它 是 用 来 检验 母 分 布 隐 
数 是 杏 为 指数 分 布 ， 即 F(x)=1-e 7 (x>0), 其 中 上 是 未 知 的 需要 用 数据 来 估计 的 
参数 (e =2.718… 是 一 个 熟知 的 常数 )， 尽管 Lilliefors 利用 上 述 的 随机 数 模拟 得 到 了 
近似 的 临界 值 ， 但 是 其 检验 统计 量 的 精确 分 布 随后 由 Durbin ( 1975 ) 与 Margolin 和 
Maurer( 1976) 年 推导 出 ， 由 于 他 们 使 用 的 方法 超出 了 本 书 的 范围 ， 因 此 在 这 里 就 不 
再 做 介绍 了 . 

一 般 理 论 表 明 ， 指 数 分 布 通常 是 用 来 描述 一 系列 随机 事件 随时 间 发 生 时 ， 中 间 间 
隔 的 时 间 长 度 ， 因 此 检验 指数 分 布 实 际 上 主要 用 来 检验 随机 性 ， 这 个 检验 的 男 一 个 应 
用 是 ,在 产品 的 寿命 内 ， 检 测 产品 的 失效 率 是 否 为 常数 ， 这 也 是 指数 分 布 的 一 个 特性 . 


> 指数 分 布 的 Lilliefors 检验 


数据 ”数据 包含 来 自 某 未 知 分 布 的 nn 个 随机 样本 义 ,X,,…,X,， 未 知 分 布 的 分 布 明 数 记 
为 F(x)， 计 算 样本 均值 作为 未 知 参数 的 一 个 估计 ， 对 每 个 X;,， 如 下 定义 Z: 
P = X:/X (5) 
它 将 用 于 检验 统计 量 的 计算 中 . 
假定 条 件 
1. 样本 是 随机 样本 . 
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检验 统计 量 ” 先 画 一 个 基于 Z, ，…，Z, 的 经 验 分 布 函数 图 像 5S(x) ， 并 在 同一 个 图 上 
画 出 函数 F" (x) =1 -e““(x >0) 的 图 像 ， 实 际 上 ， 只 需要 确定 个 点 上 的 值 便 可 ， 即 
X=Z ,X=2,， 等 等 。 可 以 用 查 表 或 计算 器 计算 e“.， 两 个 孙 数 间 的 最 大 垂直 距离 

T> = sup |F *(x) ~ S(X)| (6) 


就 是 检验 统计 量 . 
尽管 这 只 是 一 个 双边 检验 ， 但 是 Durbin( 1975) 给 出 了 单 边 检验 及 其 计算 临界 值 
所 用 的 表 . 
零 分 布 ”尽管 刚 开 始 零 分 布 的 分 位 数 由 计算 机 模拟 产生 随机 数 来 估计 ， 随 后 的 研究 
成 功 地 给 出 了 其 精确 的 分 布 ， 精确 分 位 数列 在 表 Al15 中 . 
假设 检验 
Ho: 随机 样本 服从 指数 分 布 
r={ G (7) 
其 中 上 为 未 知 参数 
Hi: X 的 分 布 不 是 指数 分 布 
检验 法 则 为 : 如果 T, 超过 表 AIS 中 的 1 -a 分 位 数 ， 则 我 们 以 显著 性 水 平 a 拒绝 H. 
近似 p- 值 由 在 表 A15 中 插值 得 到 . 
计算 机 辅助 ”S-Plus 可 以 做 Lilliefors 指数 分 布 检验 ， —— —I 
例 6. 2.2 
一 般 认为 长 途 电话 通过 电话 总 机 接 通 的 过 程 是 一 个 随机 过 程 ， 其 间 打 进 电 话 的 时 间 间 
隔 服从 指数 分 布 ， 某 个 星期 一 下 午 1:00 以 后 最 先 打 进 的 10 个 电话 发 生 在 1:06 ,1:08， 
1:16, 1:22,1:23,1:34,1:;44,1:47,1:;51 ,1:57， 第 一 个 电话 时 间 间 隔 ， 即 从 1:00 到 1:06 
为 6 (分 钟 ) ， 后 面 的 时 间 间 隔 (分 钟 ) 分 别 为 : 2,8,6,1,11,10,3,4,6， 算 得 其 样本 均 
值 为 X=5.7， 这 样 就 得 到 2,,1 -ee* 以 及 S(x) 和 F” (x) 之 间 的 距离 (在 S(x) 的 每 个 跳 
跃 点 两 端 ) 在 下 表 中 给 出 ， 为 方便 起 见 ， 我 们 把 数据 XX 按 从 小 到 大 排列 . 


i X Z=X/X 1-e- i/10—1 +e 1 — ez, — (i — 1)/10 
1 1 0.1754 0.1609 —0.0609 0.1609 
p. 2 0.3508 0.2959 一 0.0959 0.1959 
3 3 0.5263 0.4092 —0.1092 0.2092 
4 4 0.7018 0.5043 —0.1043 0.2043 
5 6 1.0526 0.6510 —0.1510 0.2510° 
6 6 1.0526 0.6510 —0.0510 0.1510 
r 6 1.0526 0.6510 0.0490 0.0510 
8 8 1.4035 0.7543 0.0457 0.0543 
9 10 1.7544 0.8270 0.0730 0.0270 
10 11 1.9298 0.8548 0.1452 —0.0452 


* S(x) — F *(x) 的 最 大 距离 - 
e F*(x) 一 S(x) 的 最 大 距离 . 
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S(x) j F* (x) 的 最 大 垂直 距离 为 0.2510. 在 a = 0.05 的 水 平 下 ， 如 果 T, 超过 
0.3244 (从 表 Al15 中 获得 , n=10, 1 -a =0.95)， 我 们 将 拒绝 指数 分 布 作为 零 假 
设 . AX T, =0.2510， 所 以 接受 零 假 设 . 通过 在 表 A15 中 插值 ， 可 得 p-(8 0. 25. 
长 途 电 话 等 待 时 间 因 此 可 认为 是 一 个 随机 过 程 . Im 
Lilliefors( 1973 ) 与 Schneider 和 Clickner( 1976 ) 把 Kolmogorov 检验 推广 到 了 带 有 
待 估 参 数 的 Gamma 分 布 情 形 ， 同 样 类 型 的 Cramér - von Mises 检验 由 Pettitt 于 1978 
年 给 出 ，Green 和 Hegazy(1976 ) 讨论 了 类 似 的 其 他 检验 
在 这 一 节 的 最 后 ， 我 们 介绍 一 个 著名 的 正 态 性 拟 合 优 度 检验 ， 它 在 很 多 情况 下 
(如 果 愿 意 的话 ) 可 用 来 代替 Liliefors 检验 ， 一 些 经 验 的 研究 表明 ， 在 检验 复合 正 态 
性 假设 时 ， 许 多 情形 下 这 种 检验 比 其 他 检验 ， 包 括 Liliefors 检验 和 x 检验 ， 有 更 高 
的 功效 (J Shapiro, Wilk 和 Chen 1968 ;La Brecque 1977)， 尽 管 这 种 检验 不 是 Kol- 
mogorov 型 检验 ， 但 由 于 它 的 作用 ， 我 们 仍 在 此 讲述 . 


P> Shapiro-Wilk 正 态 性 检验 


数据 数据 包含 来 自 某 未 知 分 布 的 n 个 随机 样本 X, Xa X, RAA i 
记得 为 F(x). 
假设 条 件 
1. 样本 是 随机 样本 . 
检验 统计 量 ”首先 计算 检验 统计 量 的 分 母 D: 
D= > (X, - X) (8) 
i=1 


其 中 , 这 是 样本 均值 .然后 将 样本 从 小 到 大 排序 
x" < x <. . - < xt) 
且 记 XX 为 第 i 个 次 序 统 计量 ， 对 n 个 样本 观测 值 ， 从 表 A16 中 得 到 系数 a, ,…,a, ,其 
中 大 大 约 为 n/2. 
检验 统计 量 T, 如 下 给 出 : 
T = 1 [> Samay S s | 
3 二 万 2 a (X X | (9) 
注意 ， 这 个 检验 统计 量 常 记 为 W， 这 个 检验 一 般 称 为 W 检验. 
零 分 布 “检验 统计 量 T, 是 相关 系数 的 平方 ， 这 里 计算 的 相关 系数 是 次 序 统 计量 x 
与 得 分 a, 之 间 的 Pearson 相关 系数 ， 其 中 a 代表 的 是 ， 当 总 体 为 正 态 分 布 时 ， 次 序 
统计 量 会 有 什么 样 的 得 分 值 ， 因 此 如 果 了 接近 1.0， 那么 样本 近似 于 服从 正 态 分 布 . 
如 果 T, 太 小 ， 也 就 是 远 小 于 1.0， 那 么 样本 非 正 态 ， 表 A17 中 给 出 了 T, 的 分 位 数 . 
假设 
Ho: F(x) 是 均值 和 标准 差 未 知 的 正 态 分 布 
H: F(x) 不 是 正 态 分 布 


[1] 
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如 果 超过 了 表 A17 中 给 出 的 a 分 位 数 ， 则 我 们 以 a 水平 拒绝 甩 ， 如 时 我 们 对 
T, 的 一 个 观测 值 想 要 更 精确 的 p- 值 ， 由 表 A18， 我们 可 以 把 T 转化 为 近似 正 态 的 随 
机 变量 ， 然 后 通过 表 Al 与 正 态 变量 分 位 数 比 较 而 获得 近似 的 p- 值 . 
计算 机 辅助 Minitab ,SAS ,StatXact 可 以 做 Shapiro-Wilk 检验 ， 一 一 一 一 一 一 一 4 
评注 
尽管 已 知 的 表格 只 允许 作 n<50 的 Shapiro-Wilk 检验 ， 但 是 D'Agostino (1971) 
提出 了 一 个 可 以 用 于 n>50 时 的 检验 ， 且 Shapiro 和 Francia( 1972) 建议 在 n > 50 时 做 
一 种 与 Shapiro- Wilk 检验 类 似 的 近似 检验 . 
例 6.2.3 
在 例 4.5.3 中 ,我 们 给 出 了 抽 自 电话 本 的 50 个 2 位 数 . x 检验 表明 接受 正 态 性 假 
设 ， 并 得 到 p- 值 为 0.25.， 在 例 6.2. 1 中 ，Lilliefors 检验 表明 接受 同样 的 假设 ， 且 p- 
值 大 于 0. 20， 同 样 对 于 这 组 数据 ， 我 们 作 Shapiro-Wilk 检验 . 
从 表 A16 中 得 到 的 系数 a, 及 次 序 统计 量 之 差 X"*” — XU ， 如 下 所 示 : 


i a, Ku — X i a, xeen ES Xin 
1 0.3751 97-23 14 0.0846 66-42 
2 02574 93-23 15 0.0764 65-43 
3 0.2260 89-24 16 0.0685 64-43 
4 0.2032 87-27 17 0.0608 63—44 
5 0.1847 81-29 18 00532 62-45 
6 0.1691 77-31 19 0.0459 61-48 
7 01554 75-32 20 0.0386 61—48 
8 01430 74-33 21 00314 59-54 
9 0.1317 73-33 22 0.0244 58-54 
10 0.1212 73-35 23 00174 58—56 
11 0.1113 70-36 24 0.0104 58-57 
12 0.1020 68-37 25 0.0035 58-57 
13 0.0932 68-40 
检验 统计 量 的 分 和子 变 为 : 
k p 
È a(X" -一 xm)| = [(0.3751)(97 — 23) + - + - + (0.0035)(58 — 57)]° 
i=l 
= [130.63 = 17,064 
分 母 为 : 
Ht 
D = ` (X; — XY = 17,698 
i=] 
所 以 检验 统计 量变 为 : 
17,064 _ 
Ty = i7698 = 0.9642 


T, 的 值 介 于 分 布 的 0. 10 5 0.50 分 位 数 之 间 ， 用 表 A17 进行 插值 得 到 p- 值 ， 大 约 
为 0. 29. 
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为 了 找到 更 精确 的 p- 值 ， 从 表 A18 中 获取 n=50 的 系数 ;bo = -7.677, c. = 
2.212, H d. =0.1436， 并 把 工 的 值 带 人 下 式 ， 得 : 


Ta — d 
G = bo + es Í e) 


0.9642 — 0.1436 
1 — 0.9642 
从 表 Al 可 知 ，G 值 对 应 于 p =0.227. 这 一 值 比 我 们 刚才 用 播 值得 到 的 产值 要 精确 . 

E 
Shapiro-Wilk 检验 所 蕴涵 的 理论 太 多 不 能 在 此 一 一 列举 ,但 是 有 兴趣 的 读者 可 以 
参看 Shapiro 和 Wilk (1965, 1968) 的 原始 文章 ,一般 说 来 ， 如 果 样 本 来 自 正 态 总 
体 ， 那 么 次 序 统 计量 与 一 些 常数 a, 的 Pearson 相关 系数 y 的 平方 ( 即 检验 统计 量 T, ) 
接近 1.0. Stephens (1975) 努力 拓展 已 知 的 表格 ， 介 显然 没有 扩大 到 我 们 现在 知道 
的 程 度 ，Hartley 和 Pfaffenberger ( 1972 ) Bowman 和 Shenton ( 1975 ), Pearson, 
D'Agosino 和 Bowman( 1975) 提出 了 一 些 新 的 正 态 性 拟 合 优 度 检验 的 方法 
Shapiro-Wilk 检验 的 一 个 很 有 用 的 特征 就 是 ， 可 以 把 几 个 独立 的 拟 合 优 度 检验 结 
果 合 并 成 一 个 来 检验 其 正 态 性 ， 这 在 某 些 情况 下 是 非常 方便 的 ， 如 一 些小 样本 可 能 
来 自 不 同 的 总 体 ， 但 它们 本 身 又 不 足以 拒绝 正 态 性 假设 ， 但 如 果 结 合 在 一 起 却 足 以 
拒绝 正 态 性 假设 . 
这 种 把 许多 独立 的 结果 结合 在 一 起 研究 的 方法 称 为 meta- 分 析 ( meta-analysis ) , 
它 包 括 把 每 个 研究 中 的 检验 统计 量 转化 为 一 个 标准 正 态 随机 变量 ， 或 者 通过 把 p- 值 
转化 为 正 态 分 布 的 分 位 数 ， 或 者 如 Shapiro-Wilk 检验 中 使 用 表 Al8 一 样 ， 直 接 通过 道 
来 转化 .然后 把 这 些 正 态 随机 变量 加 起 来 ， 除 以 样本 数 的 平方 根 ， 即 得 到 零 分 布 为 
标准 正 态 分 布 的 检验 统计 量 . Wolf( 1986) 提倡 使 用 这 种 方法 . 下 面 的 例子 将 说 明 如 
何 使 用 这 种 方法 . 
例 6. 2. 4 
当 一 个 近海 油气 井 开 始 招 标 时 ， 通 常会 有 许多 石油 公司 参与 投标 ， 以 争取 这 个 区 域 的 
石油 开采 权 ， 每 个 油气 井 的 投标 商 的 数量 服从 对 数 指数 分 布 ， 也 就 是 投标 商 数量 的 对 
数 服从 正 态 分 布 ， 然而 不 同 的 油气 井 之 间 服 从 的 分 布 的 均值 与 方差 各 不 相同 ， 同 时 ， 
任何 一 口 油气 井上 的 投标 商 通 常 太 少 以 至 不 能 确定 其 对 数 正 态 假设 是 否 合理 . 
为 了 检验 假设 : 


= —7.677 + (2.212) In ( ) = 一 0.7488 


Ho: 投标 商 的 数量 服从 对 数 正 态 分 布 
对 备 择 假设 : 它们 不 是 服从 对 数 正 态 分 布 ， 我 们 以 16 口 不 同 油气 井 的 投标 商 数量 为 样 
本 ,对 每 口 油气 井 的 投标 商 数 的 对 数 分 别 作 Shapiro - Wilk 检验 ， 结 果 在 a =0. 05 的 水 
平 下 ，16 口 油气 井中 有 4 块 拒绝 零 假设 . 然而， 有些 却 显然 与 零 假 设 十 分 的 吻合 ， 其 
Pp- 值 大 于 0.50， 因 此 ,为 了 综合 16 个 检验 的 结果 ， 我 们 采取 以 下 的 步骤 : 
1. 把 每 个 T, 值 按 表 A18 转化 成 为 G 值 . 
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2. 把 16 个 G 值 加 在 一 起 . 

3. 用 上 面 的 结果 上 除 以 vn， 得 到 Z， 它 的 分 布 在 零 假设 成 立 的 情形 下 为 近似 标 
准 正 态 . 

4. 如 果 Z 的 值 小 于 表 Al 的 a 分 位 数 ， 那 么 我 们 以 水 平 a 拒绝 零 假 设 . 

对 于 这 口 油 气井 的 计算 结果 如 下 : 


油气 井 投标 商 数 T; G 

1 14 0.9243  —0.6550 

2 14 0.9757 1.3559 

3 14 0.9717 1.0939 

4 14 0.8772  —1.5848 

5 14 0.9537 0.2345 

6 15 0.9135 —1.0093 

7 15 0.8629 — —1.9321 
8 15 ° 08786 —1.6806 

9 15 0.8515， —2.011 
10 15 0926 — -—0.7966 
11 15 0.9581 0.3354 
12 15 0.9625 0.5344 
13 16 0.9178 —1.0151 
14 16 0.8596? —241011 
15 15 0.9603 0.4323 
16 16 0.9669 0.6795 


Total —8.2099 
a 在 a = 0.05 水 平 下 显著 . 


_ —82099 _ _ 

Z= 一 元- -20525 
Z 的 值 小 于 从 表 Al 得 到 的 - 1. 6449， 所 以 在 水 平 =0.05 下 拒绝 H. AK Al 中 可 
以 看 出 p- 值 等 于 0.020. 因此 ， 对 数 正 态 的 假设 未 被 证 实 . ë 


有 一 点 必须 指出 的 是 ， 如 果 观 测 的 数据 太 大 ， 几 乎 所 有 的 拟 合 优 度 检验 部 将 拒 
绝 零 假设 .也 就 是 说 ， 现 实 中 的 数据 并 不 总 是 服从 任意 已 知 的 分 布 ， 然 而 ,这些 已 
知 的 分 布 总 是 在 合理 的 精度 范围 内 与 数据 “足够 的 接近 ”， 因 此 我 们 能 够 假设 这 些 数 
据 服 从 假设 的 分 布 ， 拟 合 优 度 检 验 是 一 种 探索 数据 与 假设 分 布 的 吻合 是 否 足够 接近 
的 方法 . 


习题 


1. 下 面 的 数据 是 随机 抽取 的 20 只 股票 的 12 个 月 的 投资 收益 : 
91 50 73 74 5.5 
86 70 43 47 8.0 
40 85 64 61 5.8 
95 52 67 83 92 


用 Lilliefors 检验 来 检验 其 正 态 性 零 假设 . 
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15 名 新 生 的 人 学 考试 成 绩 如 下 : 
481 620 642 515 740 
562 395 615 596 618 
525 584 540 580 598 


用 Lilliefors 检验 来 检验 其 正 态 性 . 
对 习题 1 中 的 假设 检验 问题 用 Shapiro-Wilk 检验 . 
对 习题 2 中 的 假设 检验 问题 用 Shapiro-Wilk 检验 . 454 
某 商 店 经 理想 检验 顾客 随机 到 达 商 店 的 假设 ， 因 此 ， 一 天 早上 ， 她 记录 下 了 连续 到 达 的 
顾客 间 的 间隔 时 间 如 下 : 
3.6 6.2 12.7 


14 33 8.2 
试 检验 零 假设 : 这 些 间 隔 时 间 服 从 指数 分 布 . 
一 段 州 际 高 速 公路 间 的 特殊 路 段 一 个 月 发 生 了 20 次 事故 ,下 面 是 事故 发 生地 之 间 的 19 个 
距离 (英里 ): 
03 61 43 33 19 
48 03 12 08 103 


12 01 10.0 16 27.6 
120 142 197 155 


这 些 事故 是 随机 地 发 生 在 这 段 公 路 上 的 吗 ? 

通常 情况 下 ， 我 们 假设 水 流量 ( 流 经 某 河 段 的 水 量 ) 数据 服从 对 数 指数 分 布 ， 为 了 验证 
这 个 假设 ， 收 集 了 不 同 大 小 的 8 条 河流 的 水 流量 数据 . 数据 包括 每 星期 测量 一 次 的 流量 
(立方 英尺 / 秒 ) ， 且 对 每 条 河流 测量 星期 的 多 少 不 一 . 用 Shapiro-Wilk 检验 来 检验 测量 数 
据 对 数 的 正 态 性 ， 结 果 如 下 : 


河流 号 测量 的 周 数 T, Jti 
1 8 0.972 
2 10 0.858 
3 6 0.875 
4 14 0.840 
5 9 0.966 
6 10 0.924 
7 14 0.881 
8 12 0.868 


综合 以 上 结果 ， 是 和 否 表 明 流 量 数据 服从 对 数 正 态 分 布 ? 
通常 认为 年 降水 量 服从 正 态 分 布 ， 收 集 了 美国 10 个 城市 的 数据 来 检验 此 假设 .对 年 降水 
最 用 Shapiro-Wilk 检验 分 析 ， 得 到 如 下 的 结果 ; 
城市 记录 的 年 数 T, 的 值 

1 18 0.875 

Š 34 0.874 

3 26 0.948 

4 43 0.980 


+ 
n 
A 
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40 0.937 
6 29 0.915 
7 35 0.915 
8 38 0.890 
9 42 0.963 
10 47 0.941 


综合 以 上 结果 ， 是 否 表 明年 降水 量 服从 正 态 分 布 ? 


6.3 两 组 独立 样本 的 检验 


当 两 组 样本 抽 自 可 能 不 同 的 总 体 时 ， 试 验 者 想 知 道 这 两 个 总 体 分 布 是 否 相 同 . 
这 一 节 中 我 们 将 要 描述 在 这 种 情形 下 十 分 有 用 的 一 些 检 验 ， 当然， 其 他 的 一 些 检验 ， 
壁 如 ， 中 位 数 检验 ，Mann-Whitney 检验 ,或 者 参数 1 检验 也 是 合适 的 ， 它们 对 于 两 
个 总 体 的 中 位 数 或 均值 差异 非常 敏感 ， 但 它们 可 能 不 能 检测 出 其 他 类 别 的 差异 ， 壁 
如 方差 的 差异 ， 本 节 要 讲述 的 两 个 双边 检验 的 一 个 优点 在 于 ， 对 两 个 分 布 图 数 间 的 
各 种 类 型 的 差异 ， 它 们 是 相合 的 〈 即 能 检测 出 差异 )， 

首先 要 讲 的 检验 是 Smirnov 检验 (Smirnov,1939). 它 是 在 6. 1 节 中 讲述 的 Kol- 
mogorov 检验 的 两 样本 时 的 情形 ， 因 此 有 时 也 称 之 为 Kolmogorov-Smironov 两 样本 检 
验 ， 相 应 地 把 Kolmogorov 检验 有 时 称 为 Kolmogorov-Smironov 一 样本 检验 ，Smirnov 
检验 有 单 边 与 双边 的 情形 . 另 一 个 要 讲 的 双边 检验 是 Cramér-von Mises 两 样本 检验 . 
ÈH Smimov 检验 稍微 难 计算 一 些 ， 但 有 许多 人 喜欢 用 它 ， 内 为 它 似乎 能 更 有 效 地 利 
用 数据 ， 实 际 上 ， 两 种 检验 在 功效 上 差异 很 小 . 


> Smirnov 检验 


数据 ”数据 包含 有 两 组 独立 的 样本 ， 一 组 容量 为 n,X,X,,…,X,; 另 一 组 容量 为 m, 
YY 用 F(x) 与 G(x) 分 别 代 表 它 们 未 知 的 分 布 函 数 . 
假定 条 件 

1. 样本 是 随机 样本 . 

2. 两 组 样本 是 相互 独立 的 . 

3. 度量 尺度 至 少 是 须 序 的 . 

4. 为 使 这 个 检验 成 为 精确 的 ， 假 设 所 用 到 的 随机 变量 为 连续 的 . 

如 果 随 机 变量 是 离散 的 ， 检 验 依然 是 正确 的 ， 但 是 变 得 保守 (I Noether, 1967a). 
检验 统计 量 记 3S,(x) 为 基于 样本 X ,X,,…,X, 的 经 验 分 布 函数 ，5,(x) 为 基于 样本 
Y ,站 ,…,Y, 的 经 验 分 布 函数 ， 对 应 于 不 同 的 假设 集 A,B,C, 相 应 的 检验 统计 量 定 义 
如 下 : 

A. (双边 检验 ) 记 检验 统计 量 T, 定义 为 两 个 经 验 分 布 函数 的 最 大 垂直 距离 : 

Tı = sup |Si() — S;(x)| (1) 
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B. ( 单 边 检验 ) 记 检验 统计 量 为 Ti 定义 为 5,(x) 在 5,(x) 之 上 的 最 大 垂直 距离 ， 
也 就 是 : 
T = sup [Si1(x) 一 S;(x)] (2) 
C. ( 单 边 检验 ) 记 检验 统计 量 为 Ti 定义 为 95(xz) 在 Si(x) 之 上 的 最 大 垂直 距离 
也 就 是 : 
Ti. *= sup [S2(x) — Si(x)] (3) 
零 分 布 ”为 了 求 得 T ,7T' ,7T， 的 精确 零 分 布 ， 我 们 考虑 在 零 假 设 成 立时 , X Fj Y 的 每 
种 排序 是 等 可 能 的 . 正如 Mann-Whitney 检验 一 样 ， 对 每 一 种 排序 ， 计 算 TT ,Ti ,Ti. 
表 A19 与 表 A20 分 别 给 出 了 有 零 分 布 在 m =n 与 mn 两 种 情形 下 的 分 位 数 . 
在 等 样本 容量 的 情形 下 ， 即 m=n 时 , TST 的 精确 分 布 为 


F(X)=1-———— (4) 


Hp, c E T x n 的 最 大 整数 . 
假设 
A. ( 双边 检验 ) 
Ho: F (x) = G(x) 对 所 有 xX e(— %,+ °) 
Hi: F (x) # G(x} 至 少 对 于 某 个 x 

如 果 T, 值 超 过 了 双边 检验 情形 下 的 1 - a 分 位 数 ， 则 我 们 以 水 平 a 拒绝 H,， 表 
A19 和 家 A20 分 别 给 出 了 m=n 和 mn 的 情形 下 的 1 -a 分 位 数 ， 对 于 大 样本 情形 ， 
虽然 表 中 未 给 出 ,但 表 的 最 后 采用 了 近似 的 方法 .近似 p- 值 可 以 通过 用 合适 的 表 进 
行 插值 得 到 . 车 m =n， 更 精确 的 p- 值 为 2 倍 精确 的 单 边 p- 值 . 

Ga 
单 边 产值 = H + nt (5) 
a 
n 
这 里 的 上 是 检验 统计 量 的 观测 值 . 
B. ( 单 边 检 验 ) 
Ho F(x) GG) ”对 所 有 xE( 一 %, +=) 
Hi:F(x) > G(x) ”至 少 对 于 某 个 x 

备 择 假设 有 时 表述 为 ,“ 和 X 倾 向 于 小 于 Y”"， 这 比 位 置 备 择 假设 :“X 与 Y 只 有 位 
置 参数 (均值 或 中 位 数 ) 不 同 ” 的 表述 更 一 般 . 

如 果 T' 值 超 过 了 单 边 检验 情形 下 的 1 - a 分 位 数 ， 则 我 们 以 水 平 a 拒绝 H, R 
A19 和 表 A20 分 别 给 出 了 mw=n #ll m= n HE FAI -a 分 位 数 ， 近似 产值 可 以 通过 
用 合适 的 表 进行 插值 得 到 .车 m =n， 精 确 的 p- 值 可 以 通过 (5) 式 得 到 . 
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C.( 单 边 检验 ) 
Ho F(x) >G) ”对 所 有 xE( 一 % ,+oo) 
HHi:F(x) < G(x) ”至 少 对 于 某 个 x 
如 果 我 们 怀疑 X 漂 移 到 了 Y 的 右边 (也 就 是 X 比 Y 大 )， 那 么 我 们 采用 这 个 单 
边 检 验 . 
如 果 7T，” 值 超过 了 单 边 检验 情形 下 的 1 -a 分 位 数 ， 则 我 们 以 水 平 a 拒绝 H, K 
A19 和 表 A20 分 别 给 出 了 m=n A m= n 的 情形 下 的 1 -a 分 位 数 . 近似 p- 值 可 以 通 
[458|] 过 用 合适 的 表 进 行 插值 得 到 、 若 m =n， 精 确 的 p- 值 可 以 通过 (5) 式 得 到 . 
计算 机 辅助 ”StarXact 可 做 这 种 检验 ， 在 软件 里 称 它 为 Kolmogorov-Smirnov 两 样本 检 
验 . 并 且 只 要 可 能 ， 就 可 以 计算 精确 pi. ———— < 
例 6. 3. 1 
从 某 个 总 体 中 抽出 一 组 容量 为 9 的 随机 样本 XX ,X,,…,X。， 从 另 一 个 总 体 中 抽出 另 
一 组 容量 为 15 的 随机 样本 Y, Ye Y 它们 的 经 验 分 布 函 数 如 图 6-8 
零 假 设 是 这 两 个 总 体 有 相同 的 分 布 图 数 . 如 果 记 它们 的 分 布 阴 数 分 别 为 F(x)， 
G(x) ， 那 么 零 假 设 可 写 为 : 
Ho: F(x) = GG) ”对 所 有 xEe( 一 %,+%) 


相应 的 备 择 假 设 为 

Hi: F(x) # G(x) 至 少 对 于 某 个 x 
为 方便 起 见 ， 我 们 把 样本 从 小 到 大 排序 ， 它们 的 值 以 及 其 它们 的 经 验 分 布 函 数 的 有 
关 信 息 如 下 给 出 : 


S(x) 


459 图 6-8 X 的 经 验 分 布 函数 8S，(x) ，Y 的 经 验 分布 函 数 5，(x) ， 以 及 它们 的 最 大 垂直 距离 
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X, Y; S,(x) —S;(x) X, Y, S(x) 一 S(x) 
5.2 0 — 1/15 = -1/15 9.8 5/9 — 8/15 = 1/45 
5.7 G= 27/15 = 2715 9.9 6/9 — 8/15 = 2/15 
5.9 0 — 3/15 = -1/5 10.1 7/9 — 8/15 = 11/45 
6.5 0 — 4/15 = -4/15 10.6 8/9 — 8/15 = 16/45 
6.8 0 — 5/15 = -1/3 10.8 8/9 — 9/15 = 13/45 
7.6 179—5715. = =2/9 11:2 1 —9/15 = 2/5 
8.2 1/9 — 6/15 = -13/45 11.3 1 — 10/15 = 1/3 
8.4 2/9 — 6/15 = ~8/45 11.5 1 — 11/15 = 4/15 
8.6 379 = 6715:= = 1215 12.3 1 — 12/15 = 1/5 
8.7 4/9 — 6/15 = 2/4 12.5 1 — 13/15 = 2/15 
9.1 4/9 — 7/15 = -1/15 13.4 1 — 14/15 = 1/15 
9.3 5/9 — 7/15 = 4/45 14.6 1-1=0 


双边 检验 的 检验 统计 量 由 (1) 式 给 出 ， 如 下 ， 
Ti = sup |S1(x) — S52(x)| = # = 0.400 
tj S (xz) 与 5,(x) 的 最 大 绝对 距离 ， 出 现在 x=11.2 和 x=11.3 之 间 . 从 图 6-8 中 
可 以 看 出 ，7 的 值 等 于 0.400， 而 且 容 易 看 出 ，S, (x) 与 5,(x) 的 距离 只 有 在 观测 
点 ,X=X 或 +=Y, 上 发 生变 化 这 就 是 为 什么 我 们 只 需要 计算 5,(x) -5,(x) 在 观 
测 点 处 的 值 的 原因 ， 

对 于 双边 检验 及 站 =9=Ni, m=15=N,, 我 们 可 以 从 表 A20 得 到 了 的 0.95 分 
位 数 ， 为 w. 。 =8/15， 对 于 这 组 数据 ，7T,， = 0.400， 因 此 在 0. 05 的 水 平 上 ， 我 们 接 
受 HH,， 从 表 中 我 们 可 以 估计 出 P- 值 稍微 大 于 0. 20. 

为 了 便于 比较 ,我们 计算 出 基于 渐 近 分 布 的 0.95 分 位 数 为 


ppa 
woss = 1.36 JL U = 0.573 
mn 


它 比 精确 值 8/15 =0. 533 稍 大 一 些 ， 这 表明 了 利用 渐 近 分 布 来 近似 容易 产生 保守 的 
检验 . 
注意 ， 这 个 例子 里 的 许多 计算 可 以 省 略 ， 因 为 我 们 可 以 通过 数据 或 5S,(x) 与 S, 
(xz) 在 图 6-8 中 的 大 致 图 像 来 观察 ， 在 许多 和 Y; 上 不 可 能 得 到 |5,(x) -5,(x) | 的 最 
大 值 ， 因 此 可 以 省 去 这 部 分 计算 ,而 只 考虑 那些 比较 有 可 能 的 X,Y 进行 计算 即 可 . 
如 果 用 单 边 检 验 适 合 ， 可 用 它 代 替 双 边 检 验 ， 那 么 从 前 面 的 数据 表 ， 对 于 假设 
B ， 检 验 统计 量 为 


T; = sup [S (x) = So(x)] = £ = 0.400 


对 于 假设 C， 检 验 统 计量 为 
Ti = sup [Sz(x) — $1(x)] = š = 0.333 


从 表 A20 可 以 看 出 ， 两 种 单 边 检验 的 p- 值 都 大 于 0. 10. E 


[461] 
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口 理论 ”尽管 初 看 上 去 不 很 显然 但 是 统计 基 7, ，T? ,Tr 仅 取 决 于 X 与 Y 在 联合 
次 序 样本 中 的 排序 ， 而 不 需要 知道 观测 的 确切 值 ， 举 个 例子 ,假设 有 3 个 XX 样本 和 2 


5 
个 Y 样 本 ， 么 在 联合 样本 中 就 有 | | = 10 种 不 同 的 排序 ， 对 于 这 些 排 序 ， 分 别 算出 
T.T. ,T, 的 值 ， 如 下 : 


排序 H 0 We 排序 f. w ¿s 
X<X<X<Y<Y 1 1 0 X<Y<X<Y<X ; 1 $ 
X< X< Y < X< Y š š 0 Y<X<X<Y<X 1 i 1 
e ea WO we y 1 ; š X< ys Y X< K š § š 
Y < X< X< X < Y L 1 ) Y<X<Y<X<X 3 0 š 
x 2 3 Y Y < X š š ; Y<Y<X<X<X 1 0 1 


如 果 双 边 检 验 中 的 零 假 设 成 立 ， 也 就 是 两 个 分 布 函 数 相同 ， 并 且 在 连续 随机 变量 的 
假设 条 件 下 ， 每 一 种 排序 都 是 等 可 能 的 ， 在 5.1 节 中 ,关于 Mann-Whitney 检验 ， 我 
们 已 用 同样 的 观点 对 此 有 更 详尽 的 讨论 ， 因 此 在 双边 检验 中 ， 每 一 种 排序 的 概率 为 : 


1 1 
概率 = i (6) 


EG 


而 且 可 以 推 得 如 下 的 概率 分 布 : 
P(T, = š) = 1/10 AT = 0175 PT = 0) = 1/5 
P(T, = B) = 3/10 P(T; = à) = 1/10 P(T; = à) = 1/10 
P(T, = š) = 2/5 P(T = )) = 1/5 PT = b = 1/5 
P(T, = 1) = 1/5 P(T = 3) = 1/5 PIT; = 3) = 1/5 
PT = $) = 1/5 PT = $) = 1/5 
P(T' =1)=1/10 P(T, =1)= 1/10 


在 n=3 和 m=2 时 ,Tr 与 77 有 相同 的 分 布 , 这 并 非 偶然 ， 事实 上 ， 对 于 任意 
的 nx，m， 它 们 都 有 相同 的 分 布 ， 为 了 节约 篇 幅 ， 当 a 很 小 时 ， 表 A 和 表 A20 利用 
了 双边 检验 T, 的 1-a 分 位 数 等 于 单 边 检验 T 的 1 -a2 分 位 数 这 一 性 质 ， 例 如 ， 
在 上 面 的 例子 中 ，P(T >1) 等 于 2 倍 的 P(T >1) ,P( 刀 =>2/3) 等 于 2 8 P(T? > 
2⁄3). 但 是 ，P(T 宇 1/2) 并 不 等 于 2 售 的 P(Ti >1⁄2). . 

单 边 检验 中 的 零 分 布 ( 即 H, 为 真 时 ， 统 计量 的 分 布 ) 也 是 通过 上 述 的 方法 得 到 
的 ， 因 为 在 单 边 零 假设 下 ， 当 F(x) 与 G(x) 相等 时 ， 临 界 域 的 水 平 是 最 大 的 .如 采 
两 组 样本 有 相同 的 样本 容量 ， 就 没有 必要 通过 上 述 方法 来 获得 上 侧 分 位 数 ， 因 为 
Gnedenko 和 Korolyuk (1951) 推导 出 了 也 Tí ,T 分 布 ， 且 分 布 是 样本 容量 n HJA 
数 ， 这 些 分 布 函数 的 推导 很 有 趣 ， 而 且 在 读者 所 学 的 数学 知识 范围 内 ， 但 由 于 篇 幅 
的 原因 ， 我 们 不 在 此 写 出 ， 读 者 可 以 参考 Fisz (1963) 来 得 到 一 个 通俗 易 懂 的 推 叶 . 

对 不 等 样本 容量 的 例子 ， 寻 找 分 位 数 的 方法 也 是 非常 基本 的 . 然而， 许多 人 利 
用 路 径 计 数 法 简化 了 上 述 “ 记 流水 账 ” 的 方法 ， 使 得 有 更 多 的 表格 能 存在 〈Harter 和 
Owen ，1970)， 关 于 Smirnov 检验 的 更 一 般 的 讨论 可 以 参看 Steck (1969)， 当 没有 精确 
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的 分 位 数 可 用 时 ， 我 们 可 以 利用 Kim (1969) 给 出 的 更 接近 精确 分 位 数 的 近似 . 口 

Tsao (1954) 建议 对 Smirnov 检验 进行 修改 ,使 它 能 用 到 截 尾 数据 上 ， 所 谓 截 尾 
数据 ， 就 是 在 X SYP, RAJ T XU BJ X, Y 能 被 观测 到 ， 这 在 生存 分 析 试验 中 时 
有 发 生 . Tsao (1954) 借助 于 迭代 办 法 得 到 的 表 ， 把 Smimov 检验 用 到 了 截 尾 样本 
E. Conover(1967a) 推导 出 了 Tsao 统计 量 分 布 的 解析 表达 式 .， Birnbaum 和 Hall 
(1960 ) 把 Smirnov 检验 推广 到 了 3 组 以 及 更 多 样本 的 情形 ， 并 对 3 组 具有 相同 样本 容 
量 的 情形 ， 他 们 给 出 了 表格 .Conover(1965，1980) 对 于 组 (k<10 ) 具有 相同 样本 
容量 的 情形 给 出 了 表格 . Conover (1967b) 介绍 了 单 边 多 组 样本 的 Smimov 检验 ， 同 时 
Conover( 1980) 给 出 了 直到 10 组 等 样本 容量 情形 的 表格 . 

下 面 要 讲 的 一 个 检验 是 Cramér-von Mises 两 样本 检验 ， 这 种 检验 只 有 双边 的 情 
形 ， 且 计算 起 来 比 Smirnov 检验 稍微 复杂 些 . 


> Cramér-von Mises 两 样本 检验 


数据 ”数据 包含 有 两 组 独立 的 样本 ，X,,X,,…,X, 与 Yate, Yn F F(x)£jG(x) 
分 别 代 表 它 们 未 知 的 分 布 呆 数 . 
假定 条 件 

1. 样本 是 随机 样本 且 相 互 独 立 . 

2. 度量 尺度 至 少 是 须 序 的 . 

3. 随机 变量 是 连续 的 ， 如 果 随 机 变量 是 离散 的 ， 那 么 检验 可 能 变 得 保守 . 
检验 统计 量 ice 5S,(x),5,(x) 分 别 为 两 组 样本 的 经 验 分 布 隐 数 ， 检 验 统 计量 T, E 
义 为 


2 
T, = TE 3 EE 5 之 [Si(x) — S;(x)] (7) 


x= i 


其 中 ， 差 平方 必须 在 每 个 X 与 Y 处 求 和 ， 显 然 可 以 把 这 个 检验 统计 量 写 为 
P [S (X) — SAX) + 之 [Si(Yi) - SAYF (8) 


b= == + "a 


零 分 布 “ 与 Smirnov 检验 和 Mann-Whitney peH, 为 了 求 检 验 统计 量 的 精确 零 分 
布 ， 我 们 考虑 在 零 假 设 成 立时 ， 对 X,Y 联合 样 本 的 每 种 排序 都 是 等 可 能 的 ， 且 对 每 
一 种 排序 ， 计 算 T, 我们 将 利用 渐 近 分 布 (n,m 一 w 时) 来 近似 所 有 样本 容量 情形 
下 的 分 布 . 
假设 

Ho: F(x) = G(x) ”对 所 有 xE( 一 % ,+ eo) 

Hi:F(X) 关 G(x) ”至 少 对 于 某 个 x 
mE T, 值 超过 了 下 表 给 出 的 1 - a 分 位 数 w a WREKE a 拒绝 H, 这 些 分 位 
数 是 建立 在 渐 近 分 布 的 基础 上 ， 对 于 m,n 很 大 的 情形 是 对 和 的， 而 且 即 使 对 于 小 样本 
的 情形 也 是 相当 的 精确 (DL Burr,1964). 
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tN10 = 0.046 tOo sn = 0.119 z0090 三 0.347 
zo020 = 0.062 Woso = 0.147 Woss = 0.461 


Wozo = 0.079 Wozo = 0.184 Woo = 0.743 
rno40 = 0.097 toogo = 0.241 iW0999 = 1.168 


这 些 值 取 自 于 Anderson 和 Darling (1952). `4 n +m=17 Bf, Burr (1964) 给 出 
了 精确 的 分 位 数 ， 近似 的 产值 可 以 通过 近似 分 位 数 插值 得 到 ， 一 14 
例 6. 3.2 
对 于 例 6. 3. 1 的 数据 ， 为 了 计算 检验 统计 量 7,， 我 们 首先 计算 
> [S1(X;) 一 SX)? = 0.459 


i= 


和 
> [Si(Y) — S:(Y) = 0.657 
那么 ， 通过 (8) 式 ， 可 算得 
5 [S1(X;) 一 SAX)? + > [S(Y) — SY] e) 


T, = 
A my + ~ 


_ (15)9) 
124)? (0.459 + 0.657) = 0.262 


则 在 a=0.05 的 水 平 上 ， 我 们 接受 分 布 相同 的 零 假 设 ， 因 为 也 =0.262， 它 小 于 
was =0.461 (刚才 已 给 出 )，p- 值 大 约 为 0.18， 这 稍微 小 于 Smimov 检验 对 这 组 数 
据 算 出 的 p- 值 . = 
口 理 论 Cramér-von Mises 两 样本 检验 统计 量 的 精确 分 布 可 以 用 和 Smirnov 检验 统计 
量 一 样 的 方法 得 到 ， 在 零 假 设 成 立 的 情况 下 ， 不 同 的 排序 在 X,Y 联合 样本 中 的 出 现 
是 等 可 能 的 ， 统 计量 可 以 通过 有 序 的 联合 样本 来 计算 .对 于 小 样本 情形 ，Ander- 
son( 1962) 和 Burr( 1963 ,1964) 利用 我 们 刚才 讲述 的 方法 和 一 些 计算 技巧 ， 得 到 了 T, 
的 精确 分 位 数 . 口 
Fisz ( 1960) 简单 地 介绍 了 统计 量 T,， 他 认为 这 个 统计 量 属于 Lehmann (1951) ， 
统计 量 的 渐 近 分 布 由 Rosenblatt (1952) 得 到 ， 但 Lehmann 和 Rosenblatt 所 研究 的 统 
计量 为 


0 + n ]° n [RY m+nl 
ig E n) ii - |D i -| k: 2(m + n) 让 > E "in| (9) 
这 与 Fisz 的 统计 量 T, RA, Riem=n. Fisz 证 明了 也 与 及 有 相同 的 渐 近 分 布 ， 其 
中 ，Rosenblatt 证 明了 T, 与 Cramér-von Mises 拟 合 优 度 检 验 统计 量 有 相同 的 渐 近 分 
布 ， 因 此 ， 实 际 上 上， 的 渐 近 分 布 是 由 Anderson 和 Darling ( 1952) 在 Cramér-von Mi- 
ses 拟 合 优 度 检验 统计 量 的 论文 所 得 到 的 .这 就 是 为 什么 把 T, 称 为 Cramér-von Mises 
两 样本 检验 统计 量 的 原因 ， 相 信 既 不 是 Cramér 也 不 是 von Mises 给 出 了 它 的 发 明 . 
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关于 圆周 上 点 的 观测 所 设计 的 两 样本 检验 ， 可 参看 Stephens ( 196Sb ) , Maag 


(1966) 以 及 Maag 和 Stephens( 1968). Bickel( 1969) 描述 了 多 元 Smirnov 检验 . Fine 
(1966) 考 虑 了 Cramér-von Mises 统计 量 ， 同 时 ，Cs6rg6 (1965) 与 Percus 和 Percus 
(1970) 讨 论 了 Smimoy 检验 的 变异 . 关于 Smirnov 检验 渐 近 效率 的 论文 参见 Capon 
( 1965) ,Ramachandramurty ( 1966 ) ,Andel( 1967 ) 以 及 Klotz ( 1967). 


Rothman 和 Woodroofe( 1972) ,Rao ,Schuster 和 Littell (1975) 把 这 些 检 验 用 来 检 


验 分 布 的 对 称 性 .Gail 和 Green( 1976a ) 为 单 边 检 验 提供 了 更 多 的 表格 ， 并 在 另 一 篇 
论文 (Gail 和 Green,1976a) 中 了 讨论 了 一 个 检验 的 很 有 趣 的 应 用 ， 更 多 理论 方面 的 讨 
论 可 以 参看 Takacs( 1971 ) 与 Kalish 和 Mikulski( 1971 ) 的 论文 . 


习题 


l. 


检验 零 假设 F(x) G(x)， 其 中 ,来 自 F(x) 的 观测 为 0.6, 0.8, 0.8, 1.2 和 1.4. 而 来 自 
G(x) 的 观测 为 1.3, 1.3, 1.8, 2.4 和 2.9. 
从 一 个 社区 随机 抽取 5 名 六 年 级 的 学 生 ， 对 他 们 进行 读 写 能 力 的 测试 ， 最 后 得 分 为 82， 
74，87，86 ，75， 再 从 另外 一 个 社区 随机 抽取 8 名 六 年 级 的 学 生 ， 对 他 们 进行 同样 的 测 
试 ， 最 后 的 得 分 为 88. 77, 91, 88, 94，93 ，83 ，94， 从 测试 来 看 ， 这 两 组 六 年 级 的 学 生 
的 读 写 成 绩 有 差别 吗 (用 Smirnov 检验 )? 
对 于 习题 2 中 的 数据 ， 用 Cramér-von Mises 检验 ， 并 把 得 到 的 结果 与 Smirnov 检验 得 到 的 
结果 进行 比较 . 
从 一 些 自愿 参加 的 高 血压 患者 中 随机 地 抽取 一 部 分 参加 治疗 A， 这 是 一 种 采用 药物 治疗 
的 办 法 ; 另 一 部 分 参加 治疗 B， 这 是 包括 低 盐 的 饮食 和 有 规律 的 运动 . 看 通过 6 个 月 后 患 
者 血压 的 变化 ， 问 这 两 种 治疗 方法 的 疗效 有 区 别 吗 ? 

疗法 舒张 血压 的 变化 

A —14, —62, —38, —19, —21, —28, —32, —40 

B —51, —31, +14, —12, —27, —38, —10, +6 
20 位 家 庭 业 主 参 加 了 一 个 节约 能 源 的 学 习 ， 将 他 们 一 部 分 随机 分 配 到 项 目 A， 通 过 日 常 
生活 慢 慢 地 灌输 节约 能 源 的 习惯 ， 另 一 部 分 分 配 到 项 目 B， 就 是 在 他 们 的 楼 顶 装 一 层 6 3 
才 厚 的 绝热 材料 ， 下 面 是 他 们 12 个 月 节约 能 源 情 况 的 数据 : 


家 庭 能 源 节 约 RÆ 能 源 节约 
业主 项 目 (美元) WE mA (美元 ) 
1 A $143 11 B $175 
2 A 106 12 B 142 
3 B 182 13 B 111 
4 B 158 14 A 82 
5 B 161 15 A 12 
6 A 108 16 A 58 
7 B 131 17 A 42 
8 A 138 18 B 96 
9 A 101 19 B 90 
10 A 83 20 B 144 


问 这 两 个 项 目的 效果 有 区 别 吗 ? 


465 


466 


6. 
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向 15 只 实验 鼠 注 人 瘤 细 胞 ， 用 来 研究 所 提出 的 治疗 方案 的 效果 其 中 6 只 老鼠 进行 了 预 
防治 疗 ， 另 外 9 只 老鼠 注 人 了 安奈 剂 〈 用 来 控制 实验 )， 在 数 个 月 后 测量 每 只 老鼠 体内 的 


瘤 的 大 小 ， 数 据 如 下 


瘤 的 大 小 
治疗 0.8, 0.0, 0.6, 1.1, 1.2, 0.5 
控制 06;16, 17, 13.22 1:5; 07, 07, 1:6 


问 这 种 治疗 在 最 终 减 小 瘤 的 大 小 上 有 效 吗 ? 


思考 题 


t 


用 文中 对 n=3,m=2 所 得 出 的 7 的 精确 分 布 ， 求 出 0. 80 ，0. 90，0. 95 分 位 数 ， 并 把 这 些 
分 位 数 与 表 A20 中 的 分 位 数 作 比 较 ， 解 释 它 们 的 差异 . 

对 n=3,，m=3, RT, T, T. MT, 的 精确 分 布 . 

对 n=m=30 与 n=m=10, 试 比较 精确 的 0.95 分 位 数 与 基于 渐 近 分 布 的 近似 分 位 数 ， 


6.4 第 1 章 至 第 6 章 复习 题 


为 了 检测 一 种 特殊 绳子 能 承受 的 最 大 拉力 (断裂 点 )， 对 10 根 绳 子 进行 了 测试 .它们 所 
能 承受 的 最 大 拉力 (FS) 如 下 : 780, 620, 910, 900, 730, 700, 630, 690, 730, 840. 
(a) 面 出 它 的 经 验 分 布 函 数 图 . 
(b) 画 出 总 体 分 布 函数 的 90% 的 置信 和 界 . 
(c) 求 总 体 中 位 数 的 近似 90% 的 置信 和 区间. 
某 个 城市 有 5 个 行政 区 ， 从 每 个 行政 区 中 随机 地 抽出 10 个 房子 ， 并 依照 房子 及 庭院 被 损 
坏 的 程度 ， 给 出 从 0 到 100 的 分 数 . (0 = 未 被 损坏 ，100 = 没有 重修 的 社会 价值 )， 下面 
是 所 得 数据 的 结果 : 

房子 ”行政 区 1 行政 区 2 行政 区 3 行政 区 4 行政 区 5 


1 08 74 92 03 37 
2 45 42 79 09 28 
3 43 77 99 22 42 
i 64 09 38 06 +H 
5 03 32 31 26 01 
6 85 66 83 20 32 
7 74 16 27 56 65 
8 48 45 76 20 02 
9 19 15 82 04 80 
10 57 24 37 29 93 


对 这 组 数据 ， 列 出 所 有 的 你 能 够 用 来 检验 行政 区 与 行政 区 不 同 的 非 参 数 检验 的 方法 ， 详 
细 地 说 明 每 种 检验 的 优 缺点 ， 选 出 你 认为 最 好 的 一 种 检验 ， 对 零 假 设 行政 区 与 行政 区 没 
有 差异 进行 检验 . 

Gwen 与 Rich 教 同 一 门 课程 的 不 同 部 分 ， 当 课程 结束 时 ， 比 较 他 们 给 学 生 的 等 级 评分 ,看 
看 他 们 所 给 等 级 分 数 的 分 布 是 否 基本 相同 : 
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A B C DAF 


Gwen 14 28 17 3 
Rich 6 22 23 7 


用 x 检验 来 检验 差异 是 否 显 著 . 
对 于 习题 3 中 的 数据 有 来 用 Kruskal-Wallis 检验 ， 并 与 习题 3 的 结果 比较 ， 想 想 在 什么 情况 
下 你 推荐 使 用 好 检验 ， 什 么 情况 下 推荐 使 用 Kruskal-Wallis 检验 ? 
(a) 判断 下 列 说 法 正确 与 否 : 
(1) 如 果 两 个 事件 互 不 相 容 ， 那么 它们 互相 独立 . 
(2) 当 样 本 量变 大 时 ， 相 合 性 检验 的 功效 趋 近 于 a. 
(3) 对 于 小 样本 ，A. R. E 是 相对 效率 的 很 好 的 近似 . 
(4) 当 样 本 来 自 双 指 数 分 布 时 ,符号 检验 比 Wilcoxon 符号 秩 检验 更 有 功效 . 
(5) 页 成 立 的 情况 下 ， 秩 统计 量 的 精确 分 布 总 是 可 以 由 简单 随机 方法 求 得 . 
(6) 如 果 出 现 很 多 的 结 ， 我 们 应 该 使 用 中 位 数 检验 代替 Kruskal-Wallis 检验 . 
(b) 用 词 填空 : 


(1) 。 ”是 临界 域 的 水 平 . 
(2) 是 样本 空间 的 子 集 . 

(3) _ 是 试验 所 有 可 能 结果 的 集合 . 

(4) 如 果 试 验 产生 了 结果 ， 那 么 我 们 拒绝 零 假设 . 


(5) 拒绝 零 假 设 的 最 小 的 显著 性 水 平 ， 称 为 

(6) 拒绝 一 个 错误 的 零 假设 的 概率 称 为 
撕 一 枚 不 均匀 的 硬币 6 次， 检验 H,:P( H) =1/3 对 H,: P(H) 关 1/3， 如 果 结 果 是 “所 有 
出 现 的 都 是 反面 朝 上 ”或 者 “正面 朝 上 的 次 数 多 于 4 次 ”， 那 么 拒绝 零 假设 Ho. 
(a) H, 是 简单 还 是 复合 假设 ? 
(b) H, 是 简单 还 是 复合 假设 ? 
(c) 列 出 在 临界 域 中 的 点 . 
(d) a 的 值 是 多 少 ? 
(e) 写 出 功效 晒 数 的 表达 式 . 
一 位 经 济 学 家 计算 了 每 月 “景气 指数 "” ， 最 近 的 24 个 月 的 值 为 : 123.6, 121.0, 124.1, 
143:4, 125.7. 129, 0, 126. 8-127. 1, 127:3, 126.7, 194.8. 125.9; 124. T, 125.9. 125.6; 
126.0, 125.7, 127.3, 127.7, 129.0, 128.2, 127.9, 127.8, 127.1. Rb% = #t Aç; 3 HB 
“景气 指数 ”有 某 些 趋势 ? 
在 某 一 特定 区 域 ， 每 年 给 一 次 “年 度 最 高 水 位 ”报告 ， 下 面 是 16 年 的 数据 (RR): 
7.4,7.8,6.9, 8.1, 8.0,7.1,7.4, 6.8, 6.9,7.6,7.6, 8.0,8.3,7.5,7.8,7.1， 零 假设 
为 : 年 度 最 高 水 位 中 位 数 小 于 8.0 英尺 ,检验 该 假设 ， 并 求 年 度 最 高 水 位 中 位 数 的 90% 
置信 区 间 . 
RET 60 次 得 到 如 下 结果 : 

显示 的 点 数 1 2 3 4 
出 现 次 数 12 10 14 8 


检验 假设 : 货 子 是 均匀 的 ， 即 每 面 有 相同 的 出 现 概 率 . 


5 6 
9 7 
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10， 从 刚 毕 业 参 加 工作 的 学 生 中 随机 地 抽取 90 名 ， 其 中 30 名 来 自 于 人 文 与 艺术 学 院 ，30 名 
来 自 于 农林 学 院 ，30 名 来 自 于 工学 院 ， 有 一 半 学 生 的 月 工资 高 于 2000 美元 ， 男 一 半 学 生 
的 月 工资 低 于 2000 美元 ， 在 那些 月 工资 高 于 2000 美元 的 人 中 , 9 名 来 自 农林 学 院 ，17 名 
来 自 人 文 与 艺术 学 院 ，19 名 来 自 工学 院 . 检验 假设 : 3 个 学 院 毕 业 生 月 工资 的 中 位 数 
相同 . 

11. 100 人 参与 了 品尝 新 牌子 的 止咳 糖浆 ， 并 说 出 什么 牌子 的 比 现 有 的 普通 的 止咳 糖浆 味道 要 
好 、 而 什么 牌子 却 不 如 此 ， 如 下 表 所 示 ，、 有 15 名 受 试 者 认为 所 有 这 4 种 新 牌子 的 味道 要 
比 现 有 的 好 ; 有 3 名 受 试 者 认为 A,B,C 这 3 个 牌子 比 现 有 的 要 好 ， 而 D 却 不 然 ; 等 等 
检验 零 假设 : 对 这 4 种 新 牌子 的 口味 偏好 没有 显著 差异 . 


牌子 对 应 的 受 试 者 人 数 
A B C D 
E:F Ll 15 
1 1 1 0 3 
1 + O 1 3 
1 0 1 1 6 
0 1 1 1 21 
1 1 0 0 1 
1 0 1 0 1 
0 1 1 0 1 
1 0 O 1 2 
0 l. 0 l 2 
0 0 1 1 19 
1 0 0 0 3 
0 1 0 O 3 
0 0 1 O 2 
0 0 0 1 13 
0 0 0 O -5 
100 


12， 下 面 的 数据 是 对 被 切除 垂体 的 老鼠 不 注射 或 注射 不 同 剂 量 的 肾上腺 皮层 荷尔蒙 4 种 方式 
处 理 ) 后 ,老鼠 的 生存 天 数 ， 

D 

13 


A{( 不 注射 ) B 


Qə 
m N 


Q) 2 2 > GQ Go N ho 
_ = 
° — 2 Q 1 > O hFn2 


C 
4 
4 
3 
4 
6 19 
5 
4 
3 
4 
S 


检验 零 假 设 : 这 4 种 情况 下 的 处 理 效果 没有 差异 ， 
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13. 下 面 的 数据 代表 的 是 4 种 不 同 种 类 的 麦子 在 13 块 不 同 的 地 块 上 的 产量 : 


麦子 种 类 
地 块 A B C D 
L 43.60 24.05 19.47 19.41 
2 40.40 2176 16.61 23.84 
3 18.08 14.19 16.69 16.08 
4 19.57 18.61 17.78 18.29 
5 45.20 29.33 2019 30.08 
6 25.87 25.60 23.31 27.04 
7 55.20 38.77 21.15 39.95 
8 55.32 34.19 18.56 25.12 
9 19.79 21.65 23.31 22.45 
10 46.24 31.52 22.48 29.28 
11 14.88 15.68 19.79 22.56 
12 7.52 469 2053 22.08 


13 41.17 3259 2925 43.95 
检验 假设 : 不 同 种 类 的 麦子 产量 没有 差异 . 
14， 下 面 的 数据 是 180 只 老鼠 从 接种 3 种 不 同类 型 的 伤寒 菌 微生物 到 死亡 的 天 数 : 
到 死亡 的 天 数 


伤寒 菌 类 型 2 3 4 5 6 7 8 9 10 1 12 13 14 
9D 1 8 18 16 3 4 1 

11C t 3.3 6 6 4 nad $ 2 ` 1 
DC i 和 二 5 R n wA y a 2 a l 


例如 ， 有 10 只 接种 了 9D 型 的 老鼠 在 第 2 天 就 死亡 了 ， 等 等 那么 老鼠 对 于 不 同类 型 的 
伤寒 菌 微生物 的 反应 是 否 有 显著 差异 ? 
15， 在 习题 14 中 ， 我 们 假设 老鼠 从 被 接种 9D 微生物 到 死亡 的 天 数 服 从 正 态 分 布 是 否 合理 ? 
16. 下面 是 12 名 男性 和 12 名 女性 能 忍受 痛苦 的 极限 值 : 
男性 85 7.9 67 74 75 86 80 81 72 80 78 78 


女性 64 78 71 80 66 73 81 74 83 89 78 77 


检验 均值 是 否 相等 ， 检 验方 差 是 否 相 等 . 
17， 下 面 是 20 个 有 代表 性 的 公司 的 普通 股票 在 1951 到 1952 年 间 的 净 收 入 : 


1951 1952 1951 1952 
$1.68 $1.71 $4.64 $4.79 
1.72 2.17 4.76 4.33 
2.50 2.25 5.35 6.05 
2.90 2.43 5.81 7.09 
3.11 2.32 6.11 6.38 
335 315 6.35 6.00 
3.80 3.30 6.69 6.01 
3.85 5.52 8.41 7.41 
3.89 3.32 883 9.33 
4.36 3.76 897 9.25 


问 从 1951 年 到 1952 年 收入 是 否 有 统计 意义 上 的 显著 上 涨 ? 
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18， 在 一 个 大 学 二 年 级 的 统计 班 里 ，10 名 自愿 受 试 者 参加 两 个 考试 ， 一 个 是 考察 数学 基础 知 
识 ， 另 一 个 是 则 前 所 学 的 课程 ， 所 得 结果 如 下 : 
学 生 ”数学 成 绩 ”目前 课程 成 绩 


1 37 23 
2 44 34 
3 55 59 
4 70 25 
5 26 16 
6 39 12 
7 26 16 
8 30 25 
9 85 60 
10 83 69 


请 问 ， 这 两 个 考试 的 成 绩 是 否 有 显著 的 相关 性 ? 
19， 在 实验 室 的 条 件 下 和 给 定 的 时 间 内 ， 对 4 种 不 同类 型 的 轮胎 进行 测试 ， 每 种 类 型 的 轮胎 
选 10 个 .试验 结束 后 ,测量 了 轮胎 的 平均 磨损 深度 (cm) ， 得 到 结果 如 下 : 


轮胎 类 型 1 类 型 2 类 型 3 类 型 4 
0.34 0.18 0.40 0.33 
0.31 0.31 0.21 0.29 
0.08 0.16 0.27 0.13 
0.26 0.00 0.38 0.24 

0.07 0.00 0.10 
0.00 0.12 0.08 0.45 
0.09 0.00 0.19 0.37 
0.14 0.00 0.36 0.19 
0.26 0.04 0.34 0.53 

10 0.19 0.09 0.44 0.56 


我 们 的 主要 兴趣 是 ， 找 出 哪 种 (或 者 哪 几 种 ) 轮胎 的 磨损 较 小 ， 如 果 有 ， 是 哪 种 (或 者 
哪 几 种 )? 

20. i X 为 一 个 家 庭 中 拥有 的 汽车 的 数量 ， 记 Y 为 一 个 家 庭 中 拥有 驾照 的 司机 的 数量 ， 下 表 
给 出 了 人 群 中 出 现 各 种 叉 与 Y 值 的 频率 . 


N Qo S ` Q > G); N => 
© 
N 
心 


X Y (X,Y) 的 概率 X Y (X, Y) 的 概率 
0 0 0.10 i 2 0.10 

0 1 0.10 2 9 0.10 

g 2 0.05 2 1 0.10 

L: 1 0.20 32 32 0.05 

t | 0.20 


(a) R E(X)Ë E(Y). 

(b) 求 X 的 中 位 数 . 

(c) 求 Y 的 方差 . 

(d) FX 5 YETMA? 

(e) Hi Y 692 fa RR. 

(f) WRA y EX, NVRR, cK (1.1). 
(g) 如 果 F(x,y) EX, Y) RR, R F(1.1). 


21. 


22. 


23. 


24. 
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(h) 求 X 与 Y 的 相关 系数 . 
下 面 的 数据 是 家 庭 拥 有 汽车 与 有 驾照 的 司机 的 随机 样本 ， 其 中 X 与 Y 的 含义 同 习 题 20， 
岂 就 是 ， 有 3 个 家 庭 既 没有 汽车 也 没有 拥有 驾照 的 司机 ， 等 等 . 
X Y 频数 X Y 频数 
0 


2 
0 
1 
2 


PP -= — oo 

=æ O N = O 

> UONG 
NNN N= 
NON 


(a) RX 5 Y 的 样本 均值 . 
(b) R X 的 样本 中 位 数 . 
(c) 求 Y 的 样本 方差 (用 n 作 分 母 ,而 不 是 nn 一 1). 
(d) miih Y 的 经 验 分 布 阴 数 图 . 
7 个 成 年 人 参加 了 一 个 旨 在 提高 阅读 速度 的 培训 班 ， 在 参加 培训 班 前 的 阅读 速度 〈 字 /分 
钟 ) 与 参加 培训 班 后 的 阅读 速度 ， 如 下 表 所 示 : 

之 前 270 250 185 310 200 260 260 

之 后 390 380 310 470 380 400 510 
求 通过 这 个 阅读 班 人 们 期 望 得 到 阅读 速度 平均 增加 的 95% 的 置信 区 间 . 
比较 两 只 黑猩猩 ，Dick 和 Jane， 看 谁 能 更 好 地 操作 并 找到 “正确 ” 键 ， 令 XX 代表 Dick 在 
按 到 “正确 ” 键 前 按键 的 次 数 ， 总 共 按 了 30 次 ; Y 代表 Jane 在 按 到 “正确 ” 键 前 按键 的 
次 数 ， 总 共 按 了 20 次 ， 从 下 面 的 表 中 是 否 可 以 说 明 某 只 黑猩猩 比 另 外 一 只 更 好 地 找到 
“正确 ” 键 . 


w 


Dick Jane 
X 频数 Y 频数 
1 12 1 12 
2 8 2 7 
3 7 3 1 
4 3 4 0 


一 个 摩托 车 手 想 看 看 用 无 铬 优化 汽油 是 否 比 普通 的 无 铅 汽油 能 跑 更 多 的 里 程 数 ， 他 每 次 
加 油 前 抛 一 次 硬币 ， 如 果 正 面 朝 上 ， 那 么 就 加 无 铅 优化 汽油 ， 如 果 反 面 朝 上 ， 则 加 普通 
的 无 铅 汽油 ， 他 每 次 把 汽油 箱 里 的 汽油 跑 完 ， 然 后 算出 一 箱 汽油 所 跑 的 里 程 ， 结果 有 3 
次 加 的 是 普通 的 无 铅 汽油 ， 所 跑 的 里 程 为 21.3, 21.2 和 21.6; 有 5 次 加 的 是 无 铅 优化 汽 
油 ， 所 跑 的 里 程 为 22.1，22.7，22.3，21.5，21. 8. 

(a) 用 无 铅 优 化 汽油 ， 他 的 车 能 跑 更 长 的 里 程 数 吗 ? 使 用 秩 检验 . 

(b) 使 用 Fisher 随机 化 检验 来 分 析 数 据 ， 并 求 得 精确 的 p- 值 . 

(c) 使 用 Smimov 检验 来 分 析 数 据 ， 并 求 得 精确 的 p- 值 . 


25. 15 位 妇女 的 年 龄 与 血压 记录 如 下 表 : 


352 # 6 3 Kolmogorov-Smirnov 型 统计 量 


年 龄 血压 年 龄 血压 
48 144 54 151 
60 168 56 152 
35 135 31 141 
38 125 24 144 
55 159 77 170 
51 148 63 157 
49 128 67 162 
38 134 


问 年 龄 和 血压 有 明显 的 单调 关系 吗 ? 
26， 用 习题 25 中 的 数据 作为 随机 样本 ， 预 测 50 岁 妇女 的 平均 血压 . 
27. 12 名 学 生 参 加 了 一 个 考试 ， 得 到 了 如 下 的 分 数 : 
62, 74, 82, 84, 86, 86, 89, 90, 94, 94, 95, 97 


473 用 拟 合 优 度 检验 来 检验 这 些 数 据 是 否 来 自 于 正 态 总 体 . 


表 Al 
表 A2 
表 A3 
s A4 
表 A6 
表 A7 
表 A8 
表 A9 
表 Al10 
表 All 
表 Al2 
表 Al3 
表 Al4 
表 Al15 
表 Al6 
表 Al17 
表 Al8 
表 Al9 
表 A20 
表 A21 
表 A22 


正 态 分 布 
x 分 布 
二 项 分 布 
二 项 参数 p 的 精确 置信 区 间 
当 r+m=1 时 ， 非 参数 容 恕 限 的 样本 容量 
当 r+m =2 时 ， 非 参数 容忍 限 的 样本 容量 
Mann-Whitney 检验 统计 量 的 分 位 数 
小 样本 Kruskal-Wallis 检验 统计 量 的 分 位 数 
平方 秩 检 验 统计 量 的 分 位 数 
Spearman p 的 分 位 数 
Kendall 检验 统计 量 T 和 Kendall 7 的 分 位 数 
Wilcoxon 符号 秩 检验 统计 量 的 分 位 数 
Kolmogorov 检验 统计 量 的 分 位 数 
Lilliefors 正 态 性 检验 统计 量 的 分 位 数 
Lilliefors 指数 分 布 检验 统计 量 的 分 位 数 
Shapiro-Wilk 检验 的 系数 
Shapiro-Wilk 检验 统计 量 的 分 位 数 
变换 Shapiro-Wilk 统计 量 到 近似 正 态 分 布 的 方法 
等 样本 容量 n 的 两 样本 Smirnov 检验 统计 量 的 分 位 数 
不 等 样本 容量 n,m 的 两 样本 Smimov 检验 统计 量 的 分 位 数 
t 分布 
自由 度 为 k, 的 下 分 布 
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RAL ERDA 
选择 人 Zoo: = —3.7190 zowmo: = —3.2905 Zoms = — 1.9600 Zog = 一 1.6449 
Zoss = 3.7190 Zoss, = 3.2905 zos = 1.9600 zos = 1.6449 
p 0.000 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 
0.00 -3.0902 -2.8782 -27478 -26521 -25758 -2521 -24573 —2409 -2.3656 
0.01 -23263 -2.2904 -2257!| -22262 ~21973 -21701 -2.1444 -2.1201 -2.0969  -20749 
0.02 -20537 -2.0335 -2014! —19954 -1.9774 一 1.9600 -1.9431 一 19268 -19110  —1.8957 
003 —1.8808 -1.8663 -1.8522 -18384 ”一 18250 ”一 1L81I9 —1.7991 —1.7866 -1.7744 -1.7624 
0.04 -1.7507 -1.7392 -1.7279 -17169 -1.7060 —1.6954 -1.6849 -1.6747 -1.6646 -1.6546 
0.05 -1.6449 -1.6352 -1.6258 —1.6164 -1.6072 -1.5982 —1.5893 -1.5805 -1.5718 -1.5632 
0.06 -15548 -1.5464 -1.5382 -15301 -1.5220 一 1.5441 —1.5063 -1.4985 -14909 -1.4833 
0.07 -14758 -14684 一 146ll -14538 -1.4466  —1.4395 -1.4325 ”一 14255 -14187 -1418 
008  —1.4051 -1.3984  —1.3917 -1.3852 -1.3787 -1.3722 —1.3658 -1.3595 —1.3532  ~1.3469 
009 -4.3408 -13346 -13285 -1.3225 — —I3I6S -1.3106 -1.3047 -1.2988 -12930 -1.2873 
0.10 -12816 —12759 -1.2702 -12646 -1.2591 —1.2536 —1.2481 -1.2426 -1.2372 -1.2319 
Ol -412265 — —122l2 -14.2460 -1.2107 —1.2055 —1.2004 -1.1952 —1.1901 —1.41850  -1.I800 
0.42  —14.1750  —1.1700 -14650 -1.1601  —1.1552 —1.4503 一 1.1455  —1.4407 一 1.4359 一 1.1311 
0.13 -1.1264  —1.1217 -LNHN70 一 L123 —1.4077 -1.1031 -10985 —1.0939 ”一 1.0893 — -10848 
0.14 “一 10803 -10758 -1.0714 -10669 -1.0625 ”一 1.0581 —1.0537 ~1.0494 ”一 1.0450 一 1.0407 
0.15 — —I0364 -10322 -10279 一 10237 -10194 —1.0152 -1.0110 —1.0069 —1.0027 ~0.9986 
0.16 -09945 -09904 -09863 -0.9822 -09782 -0.9741 —0.9701 一 0.966| 一 09621 一 0.9581 
0.I7  —0.9542 -0.9502 —0.9463 -0.9424 —09385 —0.9346 ~-09307 -09269 ”一 09230 -0.9192 
0.18 -09154 -09Il16 -09078 -0.9040 —0.9002  -—0896S -0.8927 —0.8890 -0.8853 -0.8816 
0.19  —0.8779 -0.8742 -08705 -0.8669 -08633 -0.8596 — —O8560 —0.8524 -0.8488 — 一 0.8452 
0.20 -0.84l6 — —O838I -08345 -0.8310 -08274 —0.8239 -08204 -0.8169 -0.8134 —0.8099 
0.21 -0.8064 —0.8030 -0.7995 -0.7961 —0.7926 —0.7892 -0.7858 —0.7824 -0.7790 -0.7756 
0.22  —0.7722 -0.7688 -07655 -0.7621 -0.7588 -0.7554 —0.7521 —0.7488 -0.7454  —0.7421 
0.23 -0.7388 -0.7356 -0.7323 -07290 -07257 -0.7225 —0.7192 —0.7160 —07128 -0.7095 
0.24 -07063 -0.7031 -06999 -0.6967 —0.6935 -0.6903 -0.6871 —0.6840 -0.6808  —0.6776 
025 -06745 -0.6713 -0.6682 -0.665| -0.6620 -0.6588 —0.6557  —0.6526  —0.6495 -0.6464 
0.26 -06433 —0.6403 -06377 —0.6341 -06311 —0.6280 -0.6250 -0.6219  —0.6189 一 06158 
0.27 -06l28 -0.6098 -0.6068 -0.6038 -0.6008 -0.5978 -0.5948 -0.59l8 ~0.5888 -0.5858 
0.28 -05828 -0.5799 -0.5769 -05740 -0.57I0 -0.568| -0.565| —0.5622 ~—0.5592 — 一 0.5563 
0.29 -0.5534 -0.5505 -0.5476 -0.5446 -0.54!7 -0.5388 -0.5359 — —0O5330 -0.5302 一 0.5273 
0.30 -0.5244 -0.52l5 -0.5I87 -0.5158 -0.5I29 -0.5101 —0.5072 -0.5044 ”一 05015  —0.4987 
0.31  —04959 -04930 -0.4902 -04874 -04845 -0.48l7 -0.4789 -0.476!l -0.4733 -0.4705 
0.32 -0.4677 -0.4649 -0.462| -0.4593  —0.4565 -0.4538 -0.4510 — —04482 ”一 04454  -04427 
033 -04399 -0.4372 -04344 -0.4316 -0.4289 -0426l —0.4234 -04207 ”一 04179 -0.4152 
0.34 -04125 -0.4097 04070 -0.4043 -040l6 —0.3989 -0396l -03934 -03907  —0.3880 
0.35 -03853 -03826 -03799 -03772 -03745 -0.3719 -0.3692 -03665 —0.3638 -0.3611 
036 -0.3585 -0.3558 —0.3531 -03505  —03478 0345! -0.3425  —0.3398 -0.3372 -0.3345 
037 -0.3319 -03292 —0.3266 -03239 -0.3213 —0.3186 -0.3160 —0.3134 -0.3I07 -0.3081 
0.38 -0.3055 -0.3029 —0.3002 -0.2976 —0.2950 —0.2924 -0.2898 -0.2871 —~0.2845 — -0.2819 
0.39 -0.2793 -02767 -0.2741 -027!5 —0.2689 —0.2663 -02637 -026ll —0.2585 — -0.2559 
0.40 -0.2533 -02508 -0.2482 -0.2456 —0.2430 -0.2404 -0.2378 -0.2353 —0.2327 -0.230 
0.41 -0.2275 -0.2250 -0.2224 -0.2198 -0.2173 —0.2147 -0.2121 —0.2096 -0.2070 -0.2045 
042 -0.2019 -0.1993 -0.1968 -0.1942 -0.1917 —0.1891 -0.I866 -0.1840 -0.1815  —0.1789 
043 -0.1764 -0.1738 —0.1713 -0.1687 -0.1662 -0.1637 -0.I6ll —0.1586 —0.1560 -0.1535 
0.44 -0.1510  —0.1484 -0.1459 -0.1434 -0.i408 -0.1383 —0.1358 -0.1332 —0.1307 —0.1282 
0.45 -0.1257 -0.1231 -0.1206 -0.1181 —0.1156é —0.1130 -0.1105 —0.1080 —0.t055 —0.1030 
046 —0.1004 —0.0979 —0.0954 -0.0929 -0.0904 -0.0878 -0.0853 -00828 -0.0803 —0.0778 
0.47 -0.0753 -0.0728 -0.0702 -0.0677 -0.0652 -00627 -0.0602 —0.0577 -0.0552 —0.0527 
0.48 -0.0502 -0.0476 -0.0451 —0.0426 -0.0401 -0.0376 -0.0351 ~0.0326 —0.030) -0.0276 
049  —0.0251 -0.0226 -00201 -0.0175 -0.0150 —0.0125 -0.0100 —0.0075 -0.0050 —0.0025 
0.50 0.0000 0.0025 0.0050 0.0075 0.0100 0.0125 0.0150 0.0175 0.0201 0.0226 
0.51 0.0251 0.0276 0.0301 0.0326 0.0351 0.0376 0.0401 0.0426 0.0451 0.0476 
0.52 0.0502 0.0527 0.0552 0.0577 0.0602 0.0627 0.0652 0.0677 0.0702 0.0728 
0.53 0.0753 0.0778 0.0803 0.0828 0.0853 0.0878 0.0904 0.0929 0.0954 0.0979 
0.54 0.1004 0.1030 0.1055 0.1080 0.1105 0.1130 0.1156 0.1181 0.1206 0.1231 


-一 一 


( 续 ) 

-> 000 00l 09002 D Q 0003 004 0.005 0006 007 00 0.009 
0.55 0.1257 0.1282 0.1307 0.1332 0.1358 0.1383 0.1408 0.1434 0.1459 0.1484 
0.56 0.1510 0.1535 0.1560 0.1586 0.1611 0.1637 0.1662 0.1687 0.1713 0.1738 
0.57 0.1764 0.1789 0.1815 0.1840 0.1866 0.1891 0.1917 0.1942 0.1968 0.1993 
0.58 0.2019 0.2045 0.2070 0.2096 0.2121 0.2147 0.2173 0-2198 0.2224 0.2250 
0.59 0.2275 0.2301 0.2327 0.2353 0.2378 0.2404 0.2430 0.2456 0.2482 0.2508 
0.60 0.2533 0.2559 0.2585 0.261 | 0.2637 0.2663 0.2689 0.2715 0.2741 0.2767 
0.61 0.2793 0.2819 0.2845 0.2871 0.2898 0.2924 0.2950 0.2976 0.3002 0.3029 
0.62 0.3055 0.3081 0.3107 0.3134 0.3160 0.3186 0.3213 0.3239 0.3266 0.3292 
0.63 0.3319 0.3345 0.3372 0.3398 0.3425 0.3451 0.3478 0.3505 0.353} 0.3558 
0.64 0.3585 0.3611 0.3638 0.3665 0.3692 0.3719 0.3745 0.3772 0.3799 0.3826 
0.65 0.3853 0.3880 0.3907 0.3934 0.3961 0.3989 0.4016 0.4043 0.4070 0.4097 
0.66 0.4125 0.4152 0.4179 0.4207 0.4234 0.4261 0.4289 0.4316 0.4344 0.4372 
0.67 0.4399 0.4427 0.4454 0.4482 0.4510 0.4538 0.4565 0.4593 0.4621 0.4649 
0.68 0.4677 0.4705 0.4733 0.4761 0.4789 0.4817 0.4845 0.4874 0.4902 0.4930 
0.69 0.4959 0.4987 0.5015 0.5044 0.5072 0.5101 0.5129 0.5158 0.5187 0.5215 
0.70 0.5244 0.5273 0.5302 0.5330 0.5359 0.5388 0.5417 0.5446 0.5476 0.5505 
0.71 0.5534 0.5563 0.5592 0.5622 0.565 | 0.5681 0.5710 0.5740 0.5769 0.5799 
0.72 0.5828 0.5858 0.5888 0.59!8 0.5948 0.5978 0.6008 0.6038 0.6068 0.6098 
0.73 0.6128 0.6158 0.6189 0.6219 0.6250 0.6280 0.6311 0.6341 0.6372 0.6403 
0.74 0.6433 0.6464 0.6495 0.6526 0.6557 0.6588 0.6620 0.6651 0.6682 0.6713 
0.75 0.6745 0.6776 0.6808 0.6840 0.6871 0.6903 0.6935 0.6967 0.6999 0.7031 
0.76 0.7063 0.7095 0.7128 0.7160 0.7192 0.7225 0.7257 0.7290 0.7323 0.7356 
0.77 0.7388 0.7421 0.7454 0.7488 0.7521 0.7554 0.7588 0.7621 0.7655 0.7688 
0.78 0.7722 0.7756 0.7790 0.7824 0.7858 0.7892 0.7926 0.7961 0.7995 0.8030 


0.79 0.8064 0.8099 0.8134 0.8169 0.8204 0.8239 0.8274 0.8310 0.8345 0.8381 
0.80 0.8416 0.8452 0.8488 0.8524 0.8560 0.8596 0.8633 0.8669 0.8705 0.8742 
0.81 08779 0.8816 0.8853 0.8890 0.8927 0.8965 0.9002 0.9040 0.9078 0.9116 


0.82 09154 0.9192 0.9230 0.9269 0.9307 0.9346 0.9385 0.9424 0.9463 0.9502 
0.83 09542 0.9581 0.9621 0.9661 0.9701 0.9741 0.9782 0.9822 0.9863 0.9904 
0.84 09945 0.9986 1.0027 1.0069 10H0 1.0152 1.0194 1.0237 1.0279 1.0322 
0.85 1.0364 1.0407 1.0450 1.0494 1.0537 1.0581 1.0625 1.0669 1.0714 1.0758 
0.86 1.0803 t.0848 1.0893 1.0939 1.0985 1.1031 1.1077 1.1123 1.1170 1.1217 
0.87 1.1264 L1311 1.1359 1.1407 1.1455 1.1503 1.1552 .1601 1.1650 1.1700 
0.88 1.1750 1.1800 1.1850 1.1901 1.1952 1.2004 1.2055 1.2107 1.2160 1.2212 
0.89 12265 1.2319 1.2372 1.2426 1.2481 1.2536 1.2591 1.2646 1.2702 1.2759 
0.90 12816 1.2873 1.2930 1.2988 1.3047 1.3106 1.3165 1.3225 1.3285 1.3346 
0.91 1.3408 1.3469 1.3532 1.3595 1.3658 1.3722 1.3787 1,3852 1.3917 1.3984 
0.92 — 14051 1.4118 1.4187 1.4255 1.4325 1.4395 1.4466 1.4538 1.4611 1.4684 
09 — 14758 1.4833 1.4909 1.4985 1.5063 1.5141 1.5220 1.5301 1.5382 1.5464 
0.94 1.5548 1.5632 1.5718 1.5805 1.5893 1.5982 1.6072 1.6164 1.6258 1.6352 
0.95 1.6449 1.6546 1,6646 1.6747 1.6849 1.6954 1.7060 17169 1.7279 1.7392 
0.96 17507 1.7624 1.7744 1.7866 1.7991 1.8119 1.8250 1.8384 1.8522 1.8663 
0.97 1.8808 1.8957 19110 1.9268 1.9431 1.9600 1.9774 1.9954 20141 2.0335 
098 20537 2.0749 2.0969 2.1201 2.1444 2.1701 2.1973 2.2262 2.2571 2.2904 
0.99 — 23263 2.3656 2.4089 2.4573 2.5121 2.5758 2.6521 2.7478 2.8782 3.0902 


来 源 ， 由 R.L. Iman 产生 ， 并 得 到 应 用 许可 ， 
a 表 中 的 数 是 标准 正 态 随机 变量 Z 的 分 位 数 zx, ， 满 足 P(Z<z,) =p 和 P(Z>z,) =1 -p, 注意， 其 中 
p 值 的 前 2 位 小 数 点 确定 所 用 的 行 ， 第 3 位 小 数 点 确定 来 查 到 z, 0974. 
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表 A2 x 分布 


p = 0.750 0.900 0.950 0.975 0.990 0.995 0.999 


k=! 1.323 2.706 3.841 5.024 6.635 7.879 10.83 
2 2.773 4.605 5.991 7.378 9.210 10.60 13.82 
3 4.108 6.251 7.815 9.348 11.34 12.84 16.27 
4 5.385 7.779 9.488 11.14 13.28 14.86 18.47 
5 6.626 9.236 11.07 12.83 15.09 16.75 20.51 
6 7.841 10.64 12.59 14.45 16.81 18.55 22.46 
7 9.037 12.02 14.07 16.01 18.48 20.28 24.32 
8 10.22 13.36 15.51 17.53 20.09 21.96 26.13 
9 11.39 14.68 16.92 19.02 21.67 23.59 27.88 

10 12.55 15.99 18.31 20.48 23.21 25.19 29.59 
"I 13.70 17.28 19.68 21.92 24.73 26.76 31.26 
12 14.85 18.55 21.03 23.34 26.22 28.30 32.91 
13 15.98 19.81 22.36 24.74 27.69 29.82 34.53 
14 17.12 21.06 23.68 26.12 29.14 31.32 36.12 
I5 I8.25 22.31 25.00 27.49 30.58 32.80 37.70 
16 19.37 23.54 26.30 28.85 32.00 34.27 39.25 
17 20.49 24.77 27.59 30.19 33.41 35.72 40.79 
18 21.60 25.99 28.87 31.53 34.81 37.16 42.31 
19 22.72 27.20 30.14 32.85 36.19 38.58 43.82 
20 23.83 28.41 31.41 34.17 37.57 40.00 45.32 
21 24.93 29.62 32.67 35.48 38.93 41.40 46.80 
22 26.04 30.81 33.92 36.78 40.29 42.80 48.27 
23 27.14 32.01 35.17 38.08 41.64 44.18 49.73 
24 28.24 33.20 36.42 39.37 42.98 45.56 51.18 
25 29.34 34.38 37.65 40.65 44.31 46.93 52.62 
26 30.43 35.56 38.89 41.92 45.64 48.29 54.05 
27 31.53 36.74 40.11 43.19 46.96 49.64 55.48 
28 32.62 37.92 41.34 44.46 48.28 50.99 56.89 
29 33.71 39.09 42.56 45.72 49.59 52.34 58.30 
30 34.80 40.26 43.77 46.98 50.89 53.67 59.70 
40 45.62 51.81 55.76 59.34 63.69 66.77 73.40 
50 56.33 63.17 67.50 71.42 76.15 79.49 86.66 
60 66.98 74.40 79.08 83.30 88.38 91.95 99.61] 
70 77.58 85.53 90.53 95.02 100.4 104.2 112.3 
80 88.13 96.58 101.9 106.6 112.3 116.3 124.8 
90 98.65 107.6 113.1 118.1 124.1 128.3 137.2 
100 109.1 118.5 124.3 129.6 135.8 140.2 149.4 
z, 0.675 1.282 1.645 1.960 2.326 2.576 3.090 


k> 100， 使 用 近似 值 w = { 元 )(z + VD? 或 者 更 精确 的 w =k( SSE 2) ,这 里 


z, 是 标准 正 态 分 布 的 p 分 位 数 ， 它 列 在 了 表 的 最 下 面 一 行 . 

来 源 : 从 Pearson 和 Hartley (1976) 第 一 卷 表 8 节 略 ， 经 Biometrika 委托 许可 使 用 . 

a 表 中 的 数 是 服从 自由 度 为 上 的 x? 分 布 的 随机 变量 W 的 p 分 位 数 w,， 对 选择 的 p， 满足 P(W<w,) 
=p 和 P( W > w, ) =1—p. 
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表 A4 二 项 参数 p 的 精确 置信 区 间 
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附 表 365 
( 续 ) 
90% 99% 

n Y 左 端点 右 端 点 左 端点 右 端 点 左 端点 右 端点 
13 0 0.000 0.206 0.000 0.247 0.000 0.335 
l 0.004 0.316 0.002 0.360 0.000 0.449 
2 0.028 0.410 0.019 0.454 0.008 0.541 
3 0.066 0.495 0.050 0.538 0.028 0.621 
4 0.113 0.573 0.091 0.614 0.057 0.691 
5 0.166 0.645 0.139 0.684 0.094 0.755 
6 0.224 0.713 0.192 0.749 0.138 0.811 
7 0.287 0.776 0.251 0.808 0.189 0.862 
8 0.355 0.834 0.316 0.861 0.245 0.906 
9 0.427 0.887 0.386 0.909 0.309 0.943 
10 0.505 0.934 0.462 0.950 0.379 0.972 
HI 0.590 0.972 0.546 0.981 0.459 0.992 
12 0.684 0.996 0.640 0.998 0.551 1.000 
13 0.794 1.000 0.753 1.000 0.665 1.000 
l4 0 0.000 0.193 0.000 0.232 0.000 0.315 
| 0.004 0.297 0.002 0.339 0.000 0.424 
2 0.026 0.385 0.018 0.428 0.008 0.512 
3 0.061 0.466 0.047 0.508 0.026 0.589 
4 0.104 0.540 0.084 0.581 0.053 0.658 
5 0.153 0.610 0.128 0.649 0.087 0.720 
6 0.206 0.675 0.177 0.711 0.127 0.777 
7 0.264 0.736 0.230 0.770 0.172 0.828 
8 0.325 0.794 0.289 0.823 0.223 0.873 
9 0.390 0.847 0.351 0.872 0.280 0.913 
10 0.460 0.896 0.419 0.916 0.342 0.947 
HI 0.534 0.939 0.492 0.953 0.411 0.974 
12 0.615 0.974 0.572 0.982 0.488 0.992 
13 0.703 0.996 0.661 0.998 0.576 1.000 
l4 0.807 1.000 0.768 1.000 0.685 1.000 
I5 0 0.000 0.181 0.000 0.218 0.000 0.298 
I 0.003 0.279 0.002 0.319 0.000 0.402 
2 0.024 0.363 0.017 0.405 0.007 0.486 
3 0.057 0.440 0.043 0.481 0.024 0.561 
4 0.097 0.11 0.078 0.551 0.049 0.627 
5 0.142 0.577 0.118 0.616 0.080 0.688 
6 0.191 0.640 0.163 0.677 0.117 0.744 
7 0.244 0.700 0.213 0.734 0.159 0.795 
8 0.300 0.756 0.266 0.787 0.205 0.841 
9 0.360 0.809 0.323 0.837 0.256 0.883 
10 0.423 0.858 0.384 0.882 0.312 0.920 
li 0.489 0.903 0.449 0.922 0.373 0.951 
12 0.560 0.943 0.519 0.957 0.439 0.976 
13 0.637 0.976 0.595 0.983 0.514 0.993 
14 0.721 0.997 0.681 0.998 0.598 1.000 
I5 0.819 1.000 0.782 1.000 0.702 1.000 
16 0 0.000 0.171 0.000 0.206 0.000 0.282 
0.003 0.264 0.002 0.302 0.000 0.381 
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( 续 ) 
90% 95% 99% 

n Y 左 端 点 右 端点 左 端点 右 端 点 左 端点 右 端 点 
2 0.023 0.344 0.016 0.383 0.007 0.463 
3 0.053 0.417 0.040 0.456 0.022 0.534 
4 0.090 0.484 0.073 0.524 0.045 0.599 
5 0.132 0.548 0.110 0.587 0.075 0.658 
6 0.178 0.609 0.152 0.646 0.109 0.713 
7 0.227 0.667 0.198 0.701 0.147 0.764 
8 0.279 0.721 0.247 0.753 0.190 0.810 
9 0.333 0.773 0.299 0.802 0.236 0.853 

10 0.391 0.822 0.354 0.848 0.287 0.891 
11 0.452 0.868 0.413 0.890 0.342 0.925 
12 0.516 0.910 0.476 0.927 0.401 0.955 
13 0.583 0.947 0.544 0.960 0.466 0.978 
14 0.656 0.977 0.617 0.984 0.537 0.993 
15 0.736 0.997 0.698 0.998 0.619 1.000 
16 0.829 1.000 0.794 1.000 0.718 1.000 
17 0 0.000 0.162 0.000 0.195 0.000 0.268 
| 0.003 0.250 0.001 0.287 0.000 0.363 
2 0.021 0.326 0.015 0.364 0.006 0.441 
3 0.050 0.396 0.038 0.434 0.021 0.510 
4 0.085 0.461 0.068 0.499 0.043 0.573 
5 0.124 0.522 0.103 0.560 0.070 0.631 
6 0.166 0.580 0.142 0.617 0.101 0.685 
7 0.212 0.636 0.184 0.67 | 0.137 0.734 
8 0.260 0.689 0.230 0.722 0.176 0.781 
9 0.311 0.740 0.278 0.770 0.219 0.824 
10 0.364 0.788 0.329 0.816 0.266 0.863 
11 0.420 0.834 0.383 0.858 0.315 0.899 
12 0.478 0.876 0.440 0.897 0.369 0.930 
13 0.539 0.915 0.501 0.932 0.427 0.957 
14 0.604 0.950 0.566 0.962 0.490 0.979 
15 0.674 0.979 0.636 0.985 0.559 0.994 
l6 0.750 0.997 0.713 0.999 0.637 1.000 
17 0.838 1.000 0.805 1.000 0.732 1.000 
18 0 0.000 0.153 0.000 0.185 0.000 0.255 
l 0.003 0.238 0.001 0.273 0.000 0.346 
2 0.020 0.310 0.014 0.347 0.006 0.422 
3 0.047 0.377 0.036 0.414 0.020 0.488 
4 0.080 0.439 0.064 0.476 0.040 0.549 
5 0.116 0.498 0.097 0.535 0.065 0.605 
ó 0.156 0.554 0.133 0.590 0.095 0.658 
7 0.199 0.608 0.173 0.643 0.128 0.707 
8 0.244 0.659 0.215 0.692 0.165 0.753 
9 0.291 0.709 0.260 0.740 0.205 0.795 
10 0.341 0.756 0.308 0.785 0.247 0.835 
"i 0.392 0.801 0.357 0.827 0.293 0.872 
i2 0.446 0.844 0.410 0.867 0.342 0.905 
13 0.502 0.884 0.465 0.903 0.395 0.935 
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附 表 369 
( 续 ) 
90% 95% 99% 

n Y 左 端 点 右 端点 左 端点 右 端点 左 端点 右 端 点 
21 0.802 0.998 0.772 0.999 0.708 1.000 
22 0.873 1.000 0.846 1.000 0.786 1.000 

23 0 0.000 0.122 0.000 0.148 0.000 0.206 
I 0.002 0.190 0.001 0.219 0.000 0.281 

2 0.016 0.249 0.011 0.280 0.005 0.345 

3 0.037 0.304 0.028 0.336 0.015 0.401 
4 0.062 0.355 0.050 0.388 0.031 0.453 
5 0.090 0.404 0.075 0.437 0.050 0.502 
6 0.120 0.451 0.102 0.484 0.073 0.548 
7 0.152 0.496 0.132 0.529 0.097 0.592 
8 0.186 0.540 0.164 0.573 0.125 0.634 
9 0.222 0.583 0.197 0.615 0.154 0.674 
10 0.258 0.625 0.232 0.655 0.185 0.712 
11 0.296 0.665 0.268 0.694 0.218 0.748 
12 0.335 0.704 0.306 0.732 0.252 0.782 
13 0.375 0.742 0.345 0.768 0.288 0.815 
l4 0.417 0.778 0.385 0.803 0.326 0.846 
15 0.460 0.814 0.427 0.836 0.366 0.875 
16 0.504 0.848 0.471 0.868 0.408 0.903 
17 0.549 0.880 0.516 0.898 0.452 0.927 
I8 0.596 0.910 0.563 0.925 0.498 0.950 
19 0.645 0.938 0.612 0.950 0.547 0.969 
20 0.696 0.963 0.664 0.972 0.599 0.985 
21 0.751 0.984 0.720 0.989 0.655 0.995 
22 0.810 0.998 0.781 0.999 0.719 1.000 
23 0.878 1.000 0.852 1.000 0.794 I.000 
24 0 0.000 0.117 0.000 0.142 0.000 0.198 
| 0.002 0.183 0.001 0.211 0.000 0.271 
2 0.015 0.240 0.010 0.270 0.004 0.332 
3 0.035 0.292 0.027 0.324 0.015 0.387 
4 0.059 0.342 0.047 0.374 0.029 0.438 
5 0.086 0.389 0.071 0.422 0.048 0.485 
é 0.115 0.435 0.098 0.467 0.069 0.530 
7 0.146 0.479 0.126 0.511 0.093 0.573 
8 0.178 0.521 0.156 0.553 0.119 0.614 
9 0.212 0.563 0.188 0.594 0.146 0.653 
10 0.246 0.603 0.221 0.634 0.176 0.690 
II 0.282 0.642 0.256 0.672 0.207 0.726 
I2 0.319 0.681 0.291 0.709 0.240 0.760 
13 0.358 0.718 0.328 0.744 0.274 0.793 
14 0.397 0.754 0.366 0.779 0.310 0.824 
I5 0.437 0.788 0.406 0.812 0.347 0.854 
16 0.479 0.822 0.447 0.844 0.386 0.881 
17 0.521 0.854 0.489 0.874 0.427 0.907 
18 0.565 0.885 0.533 0.902 0.470 0.931 
19 0.611 0.914 0.578 0.929 0.515 0.952 
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372 H 
(E) 
90% 95% 99% 

n Y 左 端点 右 端点 左 端点 右 端点 左 端点 右 端点 
5 0.073 0.339 0.061 0.369 0.041 0.428 
6 0.098 0.380 0.083 0.410 0.059 0.469 
7 0.124 0.419 0.107 0.449 0.079 0.508 
8 0.151 0.457 0.132 0.487 0.100 0.545 
9 0.179 0.494 0.159 0.524 0.123 0.581 

10 0.208 0.530 0.186 0.559 0.148 0.615 
Il 0.238 0.565 0.215 0.594 0.173 0.649 
12 0.269 0.600 0.245 0.628 0.200 0.681 
13 0.301 0.634 0.275 0.661 0.228 0.713 
l4 0.333 0.667 0.306 0.694 0.257 0.743 
I5 0.366 0.699 0.339 0.725 0.287 0.772 
16 0.400 0.731 0.372 0.755 0.319 0.800 
I7 0.435 0.762 0.406 0.785 0.351 0.827 
18 0.470 0.792 0.441 0.814 0.385 0.852 
19 0.506 0.821 0.476 0.841 0.419 0.877 
20 0.543 0.849 0.513 0.868 0.455 0.900 
21 0.581 0.876 0.551 0.893 0.492 0.921 
22 0.620 0.902 0.590 0.917 0.531 0.941 
23 0.661 0.927 0.631 0.939 0.572 0.959 
24 0.702 0.950 0.673 0.960 0.615 0.975 
25 0.746 0.970 0.718 0.977 0.660 0.988 
26 0.792 0.987 0.765 0.991 0.709 0.996 
27 0.841 0.998 0.817 0.999 0.763 1.000 
28 0.899 1.000 0.877 1.000 0.828 1.000 
29 0 0.000 0.098 0.000 0.119 0.000 0.167 
l 0.002 0.153 0.001 0.178 0.000 0.230 

2 0.012 0.202 0.008 0.228 0.004 0.282 
3 0.029 0.246 0.022 0.274 0.012 0.330 
4 0.049 0.288 0.039 0.317 0.024 0.374 
5 0.070 0.329 0.058 0.358 0.039 0.416 
6 0.094 0.368 0.080 0.397 0.056 0.455 
7 0.119 0.406 0.103 0.435 0.076 0.493 
8 0.145 0.443 0.127 0.472 0.096 0.530 
9 0.172 0.479 0.153 0.508 0.119 0.565 
10 0.201 0.514 0.179 0.543 0.142 0.599 
11 0.229 0.549 0.207 0.577 0.167 0.632 
I2 0.259 0.583 0.235 0.611 0.192 0.664 
13 0.289 0.616 0.264 0.643 0.219 0.695 
14 0.320 0.648 0.294 0.675 0.247 0.724 
I5 0.352 0.680 0.325 0.706 0.276 0.753 
Ió 0.384 0.71! 0.357 0.736 0.305 0.78l 
I7 0.417 0.741 0.389 0.765 0.336 0.808 
18 0.451 0.771 0.423 0.793 0.368 0.833 
19 0.486 0.799 0.457 0.821 0.401 0.858 
20 0.521 0.828 0.492 0.847 0.435 0.881 


KW: 由 R.L. Iman 所 作 ， 并 经 允许 使 用 ， 


附 k 373 
( 续 ) 
90% 95% 99% 

n Y 左 端点 右 端点 左 端点 右 端 点 左 端点 右 端点 
22 0.594 0.881 0.565 0.897 0.507 0.924 
23 0.632 0.906 0.603 0.920 0.545 0.944 
24 0.671 0.930 0.642 0.942 0.584 0.961 
25 0.712 0.951 0.683 0.961 0.626 0.976 
26 0.754 0.971 0.726 0.978 0.670 0.988 
27 0.798 0.988 0.772 0.992 0.718 0.996 
28 0.847 0.998 0.822 0.999 0.770 1.000 
29 0.902 1.000 0.881 1.000 0.833 1.000 

30 0 0.000 0.095 0.000 0.116 0.000 0.162 
l 0.002 0.149 0.001 0.172 0.000 0.223 
2 0.012 0.195 0.008 0.221 0.004 0.274 
3 0.028 0.239 0.021 0.265 0.012 0.320 
4 0.047 0.280 0.038 0.307 0.023 0.363 
5 0.068 0.319 0.056 0.347 0.038 0.404 
6 0.091 0.357 0.077 0.386 0.054 0.443 
7 0.115 0.394 0.099 0.423 0.073 0.480 
8 0.140 0.430 0.123 0.459 0.093 0.516 
9 0.166 0.465 0.147 0.494 0.114 0.550 

10 0.193 0.499 0.173 0.528 0.137 0.583 
II 0.221 0.533 0.199 0.561 0.160 0.616 
12 0.250 0.566 0.227 0.594 0.185 0.647 
13 0.279 0.598 0.255 0.626 0.211 0.677 
14 0.308 0.630 0.283 0.657 0.237 0.707 
I5 0.339 0.661 0.313 0.687 0.265 0.735 
l6 0.370 0.692 0.343 0.717 0.293 0.763 
17 0.402 0.721 0.374 0.745 0.323 0.789 
18 0.434 0.750 0.406 0.773 0.353 0.815 
19 0.467 0.779 0.439 0.801 0.384 0.840 
20 0.501 0.807 0.472 0.827 0.417 0.863 
21 0.535 0.834 0.506 0.853 0.450 0.886 
22 0.570 0.860 0.541 0.877 0.484 0.907 
23 0.606 0.885 0.577 0.901 0.520 0.927 
24 0.643 0.909 0.614 0.923 0.557 0.946 
25 0.681 0.932 0.653 0.944 0.596 0.962 
26 0.720 0.953 0.693 0.962 0.637 0.977 
27 0.761 0.972 0.735 0.979 0.680 0.988 
28 0.805 0.988 0.779 0.992 0.726 0.996 
29 0.851 0.998 0.828 0.999 0.777 1.000 
30 0.905 1.000 0.884 1.000 0.838 1.000 
n 


374 附 表 


RAS 当 r+m=1 时， 非 参 数 容 忍 限 的 样本 容量 


Ia 9=0.500 0.700 0.750 0.800 0850 0.900 0.950 0975 0.980 0.990 


0.500 I 2 3 4 5 7 14 28 35 69 
0.700 2 4 5 6 8 12 24 48 60 120 
0.750 2 4 5 7 9 14 28 55 69 138 
0.800 3 5 6 8 10 16 32 64 80 iél 
0.850 3 6 7 9 12 19 37 75 94 189 
0.900 4 7 9 II I5 22 45 91 144 230 
0.950 5 9 lI 14 19 29 59 119 149 299 
0.975 6 "I 13 17 23 36 72 146 183 368 
0.980 6 "I 14 18 25 38 77 155 194 390 
0.990 7 13 17 21 29 44 90 182 228 459 
0.995 8 15 19 24 33 51 104 210 263 528 
0.999 10 20 25 31 43 66 135 273 342 688 


a 表 中 的 数 为 样本 容量 n， 使 得 不 等 式 9" <a 成 立 ， 并 用 于 如 3. 3 节 中 描述 的 求 容忍 限 : 
P(XW 总 体 的 P 分 位 数 ) 三 1 一 a 或 
号 总体 的 9 分 位 数 生 站) >] - =. 


表 A6 当 r+m=2 时， 非 参数 容忍 限 的 样本 容量 、 


I-& q=050 0.700 0.750 0.800 0.850 0.900 0950 0.975 0.980 0.990 


0.500 3 6 7 9 lI I7 34 67 84 168 
0.700 5 8 10 12 16 24 49 97 122 244 
0.750 5 9 10 13 18 27 53 107 134 269 
0.800 5 9 11 14 19 29 59 119 149 299 
0.850 6 10 13 16 22 33 67 134 168 337 
0.900 7 12 I5 18 25 38 77 I55 194 388 
0.950 8 14 18 22 30 46 93 188 236 473 
0.975 9 17 20 26 35 54 110 221 277 555 
0.980 9 I7 21 27 37 56 115 231 290 581 
0.990 II 20 24 31 42 64 130 263 330 662 
0.995 12 22 27 34 47 72 146 294 369 740 
0.999 14 27 33 42 58 89 181 366 458 920 


a 表 中 的 数 为 样本 容量 n, ERER qg +ng" (1-4) a 成立， 并 用 于 求 容忍 限 : 
当 r+P=2 时 ,PXI 过 总 体 的 4 03 < Xr m) 三 1 一 a. 
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表 A8 小 样本 Kruskal - Wallis 检验 统计 量 的 分 位 数 * 


样本 大 小 Wo.90 Wo.9s Wo.99 

2, 2, 2 3.7143 4.5714 4.5714 
3,2,1 3.857 | 4.2857 4.2857 
3,2,2 4.4643 4.5000 5.3571 
3,3,1 4.0000 4.5714 5.1429 
3,3,2 4.2500 5.1389 6.2500 
3,3,3 4.6000 5.0667 6.4889 
4, 2, 1 4.0179 4.8214 4.8214 
4, 2, 2 4.1667 5.1250 6.0000 
4, 3, | 3.8889 5.0000 5.8333 
4, 3, 2 4.4444 5.4000 6.3000 
4,3, 3 4.7000 5.7273 6.7091 
4, 4, 1 4.0667 4.8667 6.1667 
4, 4, 2 4.4455 5.2364 6.8727 
4, 4, 3 4.7730 5.5758 7.1364 
4, 4, 4 4.5000 5.6538 7.5385 
5,2,1 4.0500 4.4500 5.2500 
5,2,2 4.2933 5.0400 6.1333 
5,3,1 3.8400 4.8711 6.4000 
5,3,2 4.4946 5.1055 6.8218 
5,3,3 4.4121 5.5152 6.9818 
5,4,1 3.9600 4.8600 6.8400 
5,4,2 4.5182 5.2682 7.1182 
5,4,3 4.5231 5.6308 7.3949 
5, 4, 4 4.6187 5.6176 7.7440 
5,5,1 4.0364 4.9091 6.8364 
5,5,2 4.5077 5.2462 7.2692 
5,5,3 4.5363 5.6264 7.5429 
5,5,4 4.5200 5.6429 7.7914 
5,5,5 4.5000 5.6600 7.9800 


- 
- 


来 源 : 经 American Mathematical Society 允许 ， 并 由 Iman, Quade 及 Alexander (1975) 改编 . 
a 如 果 由 (5.2.5) 式 给 出 的 Kruskal-Wallis 检验 统计 量 超过 表 中 给 出 的 1 -a 值 ， 则 在 水 平 a 下 可 拒 
绝 零 假设 . 


RAIS 平方 秩 检验 统计 量 的 分 位 数 ” 


p m=3 4 5 6 7 8 9 10 
0.005 14 14 14 14 14 14 21 2! 
0.01 14 14 14 14 2! 21 26 26 
0.025 14 14 21 26 29 30 35 41 
0.05 21 21 26 30 38 42 49 54 
0.10 26 29 35 42 50 59 69 77 
0.90 65 90 117 149 182 221 260 305 
0.95 70 10I 129 161 197 238 285 333 
0.975 77 110 138 170 213 257 308 362 
0.99 77 110 149 194 230 285 329 394 
0.995 77 110 149 194 245 302 346 413 
0.005 30 30 30 39 39 46 50 54 
0.01 30 30 39 46 50 SI 62 66 
0.025 30 39 50 54 63 7! 78 90 
0.05 39 50 57 66 78 90 102 114 
0.10 50 62 71 85 99 114 130 149 
0.90 ll 142 182 222 270 321 375 435 
0.95 119 154 197 246 294 350 413 476 
0.975 126 165 206 255 311 374 439 510 
0.99 126 174 219 270 334 40i 470 545 
0.995 126 174 230 281 351 414 494 567 
0.005 55 55 66 75 79 88 99 110 
0.01 55 66 75 82 90 103 115 127 
0.025 66 79 88 100 t14 130 145 162 
0.05 75 88 103 120 135 155 175 195 
0.10 87 103 121 142 163 187 212 239 
0.90 169 214 264 319 379 445 514 591 
0.95 178 228 282 342 4I0 479 558 639 
0.975 183 235 297 363 433 508 592 680 
0.99 190 246 310 382 459 543 631 727 
0.995 190 255 319 391 478 559 654 754 
0.005 91 104 115 124 136 152 167 182 
0.01 91 115 124 139 155 175 191 210 
0.025 115 130 143 164 184 208 231 255 
0.05 124 139 164 187 211 239 268 299 
0.10 136 163 187 215 247 280 315 352 
0.90 243 300 364 435 511 592 679 772 
0.95 255 319 386 463 545 634 730 831 
0.975 259 331 406 486 574 670 771 880 
0.99 271 339 424 511 607 706 817 935 
0.995 271 346 43 526 624 731 847 970 


来 源 : 由 R.L. Iman 所 作 的 原始 表 改 编 ， 经 允许 使 用 ， 
a 表 中 的 数 是 由 (5.3.3) 式 给 出 的 平方 秩 检验 统计 量 7 的 有 选择 的 P 分 位 数 wp ， 它 满足 P(T<w, ) < 
pü P(T>u,)<1-p. 临界 域 对 应 着 了 值 小 于 (或 大 于 )， 但 不 等 于 合适 的 p 分 位 数 


p m=3 4 5 6 7 8 
0.005 140 155 172 195 212 235 
0.01 155 172 191 212 236 260 
0.025 i72 195 217 245 274 305 
0.05 188 212 240 274 308 344 
0.10 203 236 27) 308 350 394 
0.90 335 407 487 572 665 764 
0.95 347 48  SI5 608 707 814 
0.975 356 43 536 635 741 856 
0.99 364 456 560 664 779 900 
0.995 371 467 571 683 803 929 
0.005 204 236 — 260 284 311 340 
0.01 221 249 276 309 340 372 
0.025 249 276 3ll 345 384 425 
0.05 268 300 340 381 426 473 
0.10 285 329 3⁄4 423 476 531 
0.90 447 536 632 735 846 965 
0.95 464 560 664 776 896 1023 
0.975 476 59 689 807 935 1071 
0.99 485 599 716 840 980 1124 
0.995 492 604 Bi 863 1005 H56 
0.005 304 325 36 393 429 466 
0.01 321 349 384 423 464 508 
0.025 342 30 423 469 517 570 
0.05 365 406 457 510 567 626 
0.10 390 444 50l 561 625 694 
0.90 581 689 803 925 1056 1195 
0.95 601 77 84 972 W2 126l 
0.975 615 741 870 1009 1158 137 
0.99 624 757 900 1049 x C 1609 1377 
0.995 629 769 916 1073 1239 1417 
0.005 406 448 486 526 573 620 
0.01 425 470 513 56l 613 667 
0.025 457 505 560 616 677 741 
0.05 486 539 601 665 734 806 
0.10 514 580 649 724 801 885 
0.90 742 86 1001 1144 1296 1457 
0.95 765 901 1045 41197 1360 1533 
0.975 778 925 1078 1241 1413 159% 
0.99 793 99 II3 1286 1470 1664 
0.995 798 91 1130 1314 1505 1708 


对 于 超过 10 B n Rm, 平方 秩 检 验 统计 量 的 p AR w, 可 由 
„P(N + IRN + 1! aY |mn(N + 1)(2N + 1)(8N + 11) 


w 
d 6 
近似 得 到 ， 这 里 z, 是 标准 正 态 分 


180 
布 的 p 分 位 数 ， 可 从 表 Al 获得 ，N =n +m. 


表 A10 Spearman p 的 分 位 数 ” 


p = 0.900 0.950 
0.8000 0.8000 
0.7000 0.8000 
0.6000 0.7714 
0.5357 0.6786 
0.5000 0.6190 
0.4667 0.5833 
0.4424 0.5515 
0.4182 0.5273 
0.3986 0.4965 
0.3791 0.4780 
0.3626 0.4593 
0.3500 0.4429 
0.3382 0.4265 
0.3260 0.4118 
0.3148 0.3994 
0.3070 0.3895 
0.2977 0.3789 
0.2909 0.3688 
0.2829 0.3597 
0.2767 0.3518 
0.2704 0.3435 
0.2646 0.3362 
0.2588 0.3299 
0.2540 0.3236 
0.2490 0.3175 
0.2443 0.3113 
0.2400 0.3059 


0.975 


0.9000 
0.8286 
0.7500 
0.7143 
0.6833 


0.6364 
0.6091 
0.5804 
0.5549 
0.5341 
0.5179 


0.5000 
0.4853 
0.4696 
0.4579 
0.4451 


0.4351 
0.4241 
0.4150 
0.4061 
0.3977 
0.3894 
0.3822 
0.3749 
0.3685 
0.3620 


0.990 


0.9000 
0.8857 
0.8571 
0.8095 
0.7667 


0.7333 
0.7000 
0.6713 
0.6429 
0.6220 
0.6000 


0.5794 
0.5637 
0.5480 
0.5333 
0.5203 


0.5078 
0.4963 
0.4852 
0.4748 
0.4654 
0.4564 
0.4481 
0.4401 
0.4320 
0.4251 


0.995 


0.9429 
0.8929 
0.8571 
0.8167 


0.7818 
0.7455 
0.7203 
0.6978 
0.6747 
0.6500 


0.6324 
0.6152 
0.5975 
0.5825 
0.5684 


0.5545 
0.5426 
0.5306 
0.5200 
0.5100 
0.5002 
0.4915 
0.4828 
0.4744 
0.4665 


0.999 


2 
对 于 大 于 30, p 的 近似 值 可 由 wb = -天 一 得 到 ， 这 里 za 是 从 表 Al 获得 的 标准 正 态 随机 变量 的 p 


分 位 数 . 


来 源 : 在 Biometrika 委托 允许 下 由 Glasser 和 Winter( 1961 ) 修改 而 来 . 


a 表 中 的 数 为 当 Spearman 秩 相 关系 数 p 作为 检验 统计 量 时 的 p 分 位 数 zj 下 侧 分 位 数 由 式 
Wp = 一 Wi-p 得 到 ， 临 界 域 对 应 着 p 值 小 于 (或 大 于 )， 但 不 等 于 合适 的 p 分 位 数 . 注意 ，p 的 中 位 


数 是 0. 
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表 All Kendall 检验 统计 量 了 = N. - N, 和 Kendall 7 的 分 位 数 (Kendall 7 
的 分 位 数 给 在 左 侧 ) ， 下 侧 分 位 数 是 上 侧 分 位 数 的 负数 w, = -w p 

n p = 9.900 0.950 0.975 0.990 0.995 

4 4 (0.6667) 4 (0.6667) 6 (1.0000) 6 (1.0000) 6 (1.0000) 

s 6 (0.6000) 6 (0.6000) 8 (0.8000) 8 (0.8000) 10 (1.0000) 

6 7 (0.4667) 9 (0.6000) 11 (0.7333) 11 {0.7333) 13 (0.8667) 

7? 9 (0.4286) 11 (0.5238) 13 (0.6190) 15 (0.7143) 17 (0.8095) 

8 10 (0.3571) 14 (0.5000) 16 (0.5714) 18 (0.6429) 20 (0.7143) 

9 12 (0.3333) 16 (0.4444) 18 (0.5000) 22 (0.6111) 24 (0.6667) 
10 15 (0.3333) 19 (0.4222) 21 (0.4667) 25 (0.5556) 27 (0.6000) 
il 17 (0.3091) 21 {0.3818) 25 (0.4545) 29 (0.5273) 31 {0.5636) 
12 18 (0.2727) 24 (0.3636) 28 (0.4242) 34 (0.5152) 36 (0.5455) 
13 22 (0.2821) 26 (0.3333) 32 (0.4103) 38 (0.4872) 42 (0.5285) 
14 23 (0.2527) 31 (0.3407) 35 (0.3846) 41 (0.4505) 45 (0.4945) 
15 27 {0.2571) 33 (0.3143) 39 (0.3714) 47 (0.4476) SI (0.4857) 
16 28 (0.2333) 36 (0.3000) 44 (0.3667) SO (0.4167) 56 (0.4667) 
17 32 (0.2353) 40 (0.2941) 48 (0.3529) 56 (0.4118) 62 (0.4559) 
18 35 (0.2288) 43 (0.2810) 51 (0.3333) 61 (0.3987) 67 (0.4379) 
19 37 (0.2164) 47 (0.2749) 55 (0.3216) 65 (0.3801) 73 (0.4269) 
20 40 (0.2105) 50 (0.2632) 60 (0.3158) 70 (0.3684) 78 (0.4105) 
2i 42 (0.2000) 54 (0.2571) 64 (0.3048) 76 (0.3619) 84 (0.4000) 
22 45 (0.1948) 59 (0.2554) 69 (0.2987) 81 (0.3506) 89 (0.3853) 
23 49 (0.1937) 63 (0.2490) 73 (0.2885) 87 {0.3439} 97 (0.3834) 
24 52 (0.1884) 66 (0.2391) 78 (0.2826) 92 (0.3333) t02 (0.3696) 
25 56 (0.1867) 70 (0.2333) 84 (0.2800) 98 (0.3267) 108 (0.3600) 
26 59 (0.1815) 75 (0.2308) 89 (0.2738) 105 (0.3231) 115 (0.3538) 
27 61 (0.1738) 79 (0.2251) 93 (0.2650) 111 (0.3162) 123 (0.3504) 
28 66 (0.1746) 84 (0.2222) 98 (0.2593) 116 (0.3069) 128 (0.3386) 
29 68 (0.1675) 88 (0.2167) 104 (0.2562 124 (0.3054) 136 (0.3350) 
30 73 (0.1678) 93 (0.2138) i09 (0.2506 129 (0.2966) 143 (0.3287) 
31 75 (0.1613) 97 (0.2086) 115 (0.2473) 135 (0.2903) 149 (0.3204) 
32 80 (0.1613) 102 (0.2056) 120 (0.2419) 142 (0.2863) 158 (0.3185) 
33 84 (0.1591) 106 (0.2008) 126 (0.2386) 150 (0.2841) 164 (0.3106) 
34 87 (0.1551) {11 (0.1979) 131 (0.2335) 155 (0.2763 173 (0.3084) 
35 91 (0.1529) 115 (0.1933) 137 (0.2303) 163 (0.2739) 179 (0.3008) 
36 94 (0.1492) 120 (0.1905) 144 (0.2286 170 (0.2698) 188 (0.2984) 
37 98 (0.1471) 126 {0.1892) 150 (0.2252 176 (0.2643) 198 (0.2943) 
38 103 (0.1465) 131 (0.1863) 155 (0.2205) 183 (0.2603) 203 (0.2888) 
39 107 (0.1444) 137 (0.1849) 161 (0.2173) 191 (0.2578) 211 (0.2848) 
40 110 (0.1372) 142 (0.1821) 168 (0.2154) 198 (0.2538) 220 (0.2821) 
4i t14 (0.1390) 146 (0.1780) 174 (0.2122) 206 (0.2512) 228 (0.2780) 
42 119 (0.1382) ISI (0.1754) 181 (0.2102) 213 (0.2474) 235 (0.2729) 
43 123 (0.1362) 157 (0.1739) 187 (0.2071) 221 (0.2447) 245 (0.2713) 
44 128 (0.1353) t62 (0.1712) 194 (0.2051) 228 (0.2410) 252 (0.2664) 
45 132 (0.1333) 168 (0.1697) 200 (0.2020) 236 (0.2383) 262 {0.2646) 
46 135 (0.1304) 173 (0.1671) 207 (0.2000) 245 (0.2367) 271 (0.2618) 
47 141 (0.1304) 179 (0.1656) 213 (0.1970} 253 (0.2340) 279 (0.2581) 
48 144 (0.1277) 186 (0.1649) 220 (0.1950) 260 (0.2305) 288 (0.2553) 
49 t50 (0.1276) 190 (0.1616) 228 (0.1939) 268 (0.2279) 296 (0.2517) 
50 153 (0.1249) 197 (0.1608) 233 (0.1902) 277 (0.2261) 305 (0.2490) 
51 159 (0.1247) 203 (0.1592) 241 (0.1890) 285 (0.2235) 315 (0.2471) 
52 162 (0.1222) 208 (0.1569) 248 (0.1870) 294 (0.2217) 324 (0.2443) 
53 168 (0.1219) 214 (0.1553) 256 (0.1858) 302 (0.2192) 334 (0.2424) 
54 173 (0.1209) ` 221 (0.1544) 263 (0.1838) 311 (0.2173) 343 (0.2397) 
55 177 (0.1192) 227 (0.1529) 269 (0.1811) 319 (0.2148) 353 (0.2377) 
56 182 (0.1 182) 232 (0.1506) 276 (0.1792) 328 (0.2130) 362 (0.2351) 
57 186 (0.1165) 240 (0.1504) 284 (0.1779) 336 (0.2105) 372 (0.2331) 
58 191 (0.1155) 245 (0.1482) 291 (0.1760) 345 (0.2087) 381 (0.2305) 
59 197 (0.1151) 251 (0.1467) 299 (0.1748) 355 (0.2075) 391 (0.2285) 
60 202 (0.1141) 258 (0.1458) 306 (0.1729) 364 (0.2056) 402 {0.2271} 
对 于 n 大 于 60, TRER p 分 位 数 可 由 w, = z, je en + 5) 得 到 ， 这 里 z, ER Al 给 出 的 标准 正 

V 2(2n + 5) 


态 分 布 的 记分 位 数 ，r 的 近似 分 位 数 可 由 Ww, = z, Vm 


临界 域 对 应 着 了 值 小 于 (或 大 于 ) ， 但 不 等 于 某 合适 的 p 分 位 数 ” 注 意 , T 的 中 位 数 是 0, + 的 近似 
分 位 数 可 由 了 的 分 位 数 除 以 n(n -1)/2 得 到 . 
来 源 : 经 作者 同意 由 Best( 1974) 表 1 改编 . 


表 A12 Wilcoxon 符号 秩 检验 统计 量 的 分 位 数 


n(n + 1) 
Wuo.oos Wo.o1 Wo.025 Wo.os Wo.t0 Woo Wo30 Wo. Wo.so 2 

= 4 0 0 0 0 l 3 3 4 5 10 

5 0 0 0 | 3 4 5 6 7.5 I5 

6 0 0 | 3 4 6 8 9 I0.5 21 

7 0 I 3 4 6 9 I!) 12r 14 28 

8 | 2 4 6 9 12 14 16 18 36 

9 2 4 6 9 HI I5 18 20 22.5 45 
10 4 6 9 l I5 19 22 25 27.5 55 
III 6 8 ll 14 I8 23 27 30 33 66 
12 8 10 14 18 22 28 32 36 39 78 
13 10 t3 18 22 27 33 38 42 45.5 91 
i4 13 i6 22 26 32 39 44 48 52.5 105 
15 16 20 26 31 37 45 5} 55 60 t20 
16 20 24 30 36 43 51 58 63 68 136 
I7 24 28 35 42 49 58 65 7i 76.5 153 
18 28 33 4l 48 56 66 73 80 85.5 171 
19 33 38 47 54 63 74 82 89 95 190 
20 38 44 53 6i 70 83 9I 98 105 210 
21 44 50 59 68 78 91 100 108 115.5 231 
22 49 56 67 76 87 100 110 119 126.5 253 
23 55 63 74 84 95 110 120 130 138 276 
24 62 70 82 92 105 120 13i 141 150 300 
25 69 77 90 101 114 131 143 I53 162.5 325 
26 76 85 99 111 125 142 155 i65 175.5 351 
27 84 94 108 120 135 154 167 178 189 378 
28 92 102 117 131 146 166 180 192 203 406 
29 101 II I27 141 158 178 193 206 217.5 435 
30 110 121 138 152 170 i91 207 220 232.5 465 
31 119 131 148 164 182 205 221 235 248 496 
32 I29 141 160 176 195 219 236 250 264 528 
33 139 152 i71 188 208 233 251 266 280.5 56i 
34 149 163 183 201 222 248 266 282 297.5 595 
35 160 175 196 214 236 263 283 299 315 630 
36 172 187 209 228 251 279 299 317 333 666 
37 184 199 222 242 266 295 316 335 351.5 703 
38 196 212 236 257 282 312 334 353 370.5 741 
39 208 225 250 272 298 329 352 372 390 780 
40 22! 239 265 287 314 347 371 391 410 820 
4l 235 253 280 303 331 365 390 411 430.5 861 
42 248 267 295 320 349 384 409 431 451.5 903 
43 263 282 311 337 366 403 429 452 473 946 
44 277 297 328 354 385 422 450 473 495 990 
45 292 313 344 372 403 442 471 495 517.5 1035 
46 308 329 362 390 423 463 492 517 540.5 1081 
47 324 346 379 408 442 484 514 540 564 1128 
48 340 363 397 428 463 505 536 563 588 1176 
49 357 381 416 447 483 527 559 587 612.5 1225 
50 374 398 435 467 504 550 583 éll 637.5 i275 


对 于 n 超过 50，Wilcoxon 符号 秩 检验 统计 量 的 p 分 位 数 可 由 
wp = [n(n + 1)/4] + zp Vn(n + 1)(2n + 1)/24 


近似 得 到 .这 里 z, 是 标准 正 态 分 布 的 p 分 位 数 ， 可 从 表 Al 获得 . 

来 源 : 由 Harter 和 Owen (1970) 改编 ， 经 American Mathematical Society 允许 使 用 . 

a 表 中 的 数 是 Wilcoxon 符号 秩 检验 统计 最 T 的 p 分 位 数 w,， 选择 p<0.50 由 (5.7.3) 式 给 出 ， 对 
于 p>0.50 可 由 等 式 w, =n(n+1)/2 -wl -pb 计 算得 到 ， 这 里 n(n+1)/2 是 表 中 最 右边 的 列 ， 注 意 ， 如 
果 RT, 则 有 P(T+ <w,)<p fl P(T* >w,)=<1-p. 临界 域 对 应 着 7 值 小 于 (或 大 于 ) ， 但 不 等 于 
某 合适 的 p 分 位 数 . 


表 A13 Kolmogorov 检验 统计 量 的 分 位 数 ” 


单 边 检验 
p=0.90 095 0.975 099 0.995 p=0.90 0.95 0.975 099 0.995 
双边 检验 

p=0.80 0.90 095 0.98 0.99 p=0.80 090 0.95 0.98 0.99 

n=l 0.900 0.950 0.975 0.990 0.995 n=2i 0.226 0.259 0.287 0.321 0.344 
2 0684 0776 0842 0.900 0.929 22 0221 0253 0281 0.314 0.337 

3 0565 0.636 0.708 0.785 0.829 23 0216 0.247 0.275 0.307 0.330 

4 0493 0.565 0624 0.689 0.734 24 0212 0.242 0.269 0.301 0.323 

S 0.447 0509 0.563 0.627 0.669 25 0.208 0.238 0.264 0.295 0.317 

6 040 0468 0.519 0.577 0.617 26 0204 0233 0.259 0.290 0311 

7 0.381 0.436 0.483 0.538 0.576 27 0200 0.229 0.254 0.284 0.305 

8 0358 0.410 0.454 0.507 0.542 28 0.197 0.225 0.250 0.279 0.300 

9 0.339 0.387 0.430 0.480 0.513 29 0.193 0.22} 0.246 0.275 0295 

10 0323 0.369 0.409 0457 0.489 30 0.190  0.2Ii8 0.242 0270 0.290 
ii 0308 0.352 0391 0.437 0.468 31 0187 0214 0238 0.266 0.285 
I2 026 0.338 0.375 0.419 0449 32 0184 02Il 0.234 0.262 0281 
i3 0285 0.325 0.361 0.404 0.432 33 0.182 0.208 0.231 0.258 0.277 
14 0.275 0.314 0.349 0.390 0.418 34 0.179 0.205 0.227 0.254 0.273 
IS 0.266 0.304 0338 0.377 0404 35 0177 0202 0.224 0.251 0.269 
16 0.258 0295 0.327 0.366 0.392 36 0.174 0199 0.221 0.247 0.265 
I7 0.250 0.286 03I8 0.355 0.381 37 0172 0.19% 02i8 0244 0.262 
I8 0.244 029 0.309 0346 0.371 38 0.170 0.194 0215 024 0258 
19 027 0271 0301 0337 036l 39 0168 0191 0213 0238 0.255 
20 022 0.265 0.294 0329 0.352 40 0165 0.189 0.210 0.235 0.252 
107 122 136 152 163 

>40 的 近似 值 Vn Vn Vn Vn Vn 


来 源 : 由 Miller (1956) 改编 ， 经 American Statistical Association 允许 使 用 . 

a 表 中 的 数 是 由 (6.1.1) 式 定义 的 Kolmogorov 双边 检验 统计 基 T, 由 (6.1.2) 和 (6.1.3) 式 定义 
的 T- RT 单 边 检验 的 有 选择 的 p 分 位 数 w,。， 如 果 了 超过 表 中 1 一 a 分 位 数 ， 则 以 水 平 a 拒绝 Ho. 
在 n<40 的 双边 检验 中 ， 这 些 分 位 数 是 精确 值 ， 其 余 的 分 位 数 是 近似 值 ， 但 在 大 多 数 情形 下 等 于 精 
确 值 ， 对 于 n>40， 分母 则 用 (n+ Yn10) 中 代替 Yn， 则 近似 会 更 好 些 . 


表 Al4 Liliefors 正 态 性 检验 统计 量 的 分 位 数 ” 


p = 0.80 0.85 0.90 0.95 0.99 
样本 大 小 n = 4 0.303 0.320 0.344 0.374 0.414 
5 0.290 0.302 0.319 0.344 0.398 
6 0.268 0.280 0.295 0.321 0.371 
7 0.252 0.264 0.280 0.304 0.353 
8 0.239 0.251 0.266 0.290 0.333 
9 0.227 0.239 0.253 0.275 0.319 
10 0.217 0.228 0.241 0.262 0.303 
ll 0.209 0.219 0.232 0.252 0.291 
12 0.201 0.210 0.223 0.243 0.281 
13 0.193 0.203 0.215 0.233 0.270 
14 0.187 0.196 0.209 0.227 0.264 
I5 0.181 0.190 0.202 0.219 0.256 
16 0.176 0.184 0.195 0.212 0.248 
I7 0.170 0.179 0.190 0.207 0.241 
18 0.166 0.174 0.185 0.201 0.234 
19 0.162 0.171 0.181 0.197 0.230 
20 0.159 0.167 0.177 0.192 0.223 
2i 0.155 0.163 0.173 0.188 0.219 
22 0.152 0.160 0.170 0.185 0.214 
23 0.149 0.156 0.165 0.181 0.210 
24 0.145 0.153 0.162 0.177 0.205 
25 0.144 0.151 0.159 0.173 0.202 
26 0.141 0.147 0.156 0.170 0.198 
27 0.138 0.145 0.153 0.166 0.193 
28 0.136 0.142 0.151 0.165 0.19) 
29 0.134 0.140 0.149 0.162 0.188 
30 0.132 0.138 0.146 0.159 0.183 
>31 0.741 0.775 0.819 0.895 1.035 
d, d, 中 d, d, 


d, = (Vn — 0.01 + 0.83/ Vn) 


来 源 : Mason 和 Bell( 1986) š L. 5, £ Marcel Dekker, Inc 允许 使 用 . 
a 表 中 的 数 是 (6. 2.4) 式 定义 的 Liliefors RERH E T, 的 分 位 数 w 的 近似 值 ， 对 指定 样本 大 小 为 
n, WÈ T, 超过 wi _。， 则 以 水 平 a 拒绝 Ho. 
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0.7071 
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表 A16 Shapiro-Wilk 检验 的 系数 “ 


4 5 6 7 
0.6872 0.6646 0.6431 0.6233 
0.1667 0.2413 0.2806 0.3031 

一 0.0000 0.0875 0.1401 
一 一 一 0.0000 

13 14 15 16 17 
0.5359 0.5251 0.5150 0.5056 0.4968 
0.3325 0.3318 03306 0.3290 0.3273 
0.2412 0.2460 0.2495 0.2521 0.2540 
0.1707 0.1802 0.1878 0.1939 0.1988 
0.1099 0.1240 0.1353 0.1447 0.1524 
0.0539 0027 0.0880 0.1005 0.1109 
0.0000 0040 00433 0.0593 0.0725 

一 一 0.0000 00196 0.0359 

一 一 一 — 0.0000 

23 24 25 26 27 
0.4542 0.4493 0.4450 0.4407 0.4366 
0.3126 0.3098 0.3069 0.3043 0.3018 
0.2563 0.2554 0.2543 0.2533 0.2522 
0.2139 02145 0.2148 02151 0.2152 
0.1787 0.1807 0.1822 0.1836 0.1848 
0.1480 0.1512 0.1539 0.1563 0.1584 
0.120! 0.1245 0.1283 0.1316 0.1346 
0.0941 0.0997 0.1046 0.1089 0.1128 
0.0696 0.0764 0.0823 0.0876 0.0923 
0049 0039 0.0610 0.0672 0.0728 
0.0228 0.0321 0.0403 0.0476 0.0540 
0.0000 0.0107 0.0200 0.0284 0.0358 

— 一 0.0000 0094 0.018 

一 一 一 一 0.0000 


388 H + 
( 续 ) 
N 31 32 33 34 35 36 37 38 39 40 
' 0.4220 0.4188 0.4156 0.4127 0.4096 0.4068 04040 0405 0.3989 03964 
2 0.2921 0.2898 0.2876 0.2854 0.2834 028013 0.2794 02774 0.2755 0.2737 
3 0.2475 0.2462 0.2451 0.2439 0.2427 0.24l5 0.2403 0.239} 0.2380 0.2368 
4 0.2145 0.2141 0.2137 0.2132 0.2127 0.2121 0.2116 “0.21I0 0.2104 0.2098 
5 0.1874 0.1878 0.1880 0.1882 0.1883 0.1883 0.1883 0.1881 0.1880 0.1878 
6 0.1641 “0.1651 0.1660 0.1667 0.1673 0.1678 0.1683 0.1686 0.1689 0.1691 
7 0.1433 0.1449 0.1463 0.1475 0.1487 0.1496 0.1505 0.1513 0.1520 0.1526 
8 0.1243 0.1265 0.1284 0.1301 013I7 0.1331 0.1344 0.1356 0.1366 0.1376 
9 0.1066 0.1093 04118 01140 Oll60 0.1179 0.1196 02 0.1225 0.1237 
10 0.0899 0.0931 0.0961 0.0988 0.1013 0.1036 0.1056 0.1075 0.1092 0.1108 
" 0.0739 _ 00777 0.0812 0.0844 0.0873 0090 00924 0.0947 0.0967 00986 
I2 00585 00629 0.0669 0.0706 0.0739 0.0770 00798 0.0824 0.0848 009870 
13 0.0435 0.0485 00530 0.0572 “0.0610 0.0645 0.0677 0.0706 0.0733 0.0759 
14 00289 00344 0.0395 0.0441 0.0484 0.0523 0.0559 0.0592 00622 0.065! 
I5 0.0144 0.0206 0.0262 0.0314 0.0361 0.0404 0.0444 004 0.0515 0.0546 
16 0.0000 0.0068 0.0131 0.0187 0.0239 0.0287 0.0331 0.0372 0.0409 0.0444 
17 — — 0.0000 0.0062 00119 00172 0.0220 0.0264 00305 00343 
i8 a 一 = 0.0000 0.0057 000 0.0158 0003 00244 
19 一 — = — 一 = 0.0000 0.0053 0.0101 0.0146 
20 一 一 一 一 一 ~ 一 一 0.0000 0.0049 
h er 41 42 43 44 45 46 47 48 49 50 
1 0.3940 0.3917 0.3894 03872 0.3850 0.3830 03808 0.3789 0.3770 0.3751 
2 0.2719 02701 0.2684 0.2667 0.2651 0.2635 0.2620 0.2604 0.2589 02574 
3 0.2357 0.2345 0.2334 0.2323 0.2313 0.2302 0.2291 0.2281 0.2271 0.2260 
4 0.209 0.2085 0.2078 0.2072 0.2065 0.2058 0.2052 0.2045 0208 02032 
5 0.1876 0.1874 0.1871 0.1868 0.1865 0.1862 0.1859 0.1855 0.1851 0.1847 
6 0.1693 01694 0.1695 0.1695 0.1695 0.1695 0.1695 0.1693 ”0.1692 0.1691 
7 0.1531 0.1535 0.1539 0.1542 0.1545 0.1548 0.1550 0.4551 0.1553 0.1554 
8 0.1384 0.1392 0.1398 0.1405 0.1410  0.14i5 0.1420 0.1423 0.1427 0.1430 
9 0.1249 0.1259 0.1269 0.1278 0.1286 0.1293 0.1300 0.1306 0.312 0.317 
10 0.1123 0.1136 0.1149 0.1160 0.1170 01Il80 0.1l89 01197 0.1205 0.212 
"I 0.1004 0.1020 0.1035 0.1049 201062 0.1073 0.1085 0.1095 0.1105 0.1113 
12 0.0891 0.0909 0.0927 0.0943 0.0959 0.0972 0.0986 0.0998 0.1010 0.020 
13 0.0782 0.0804 0.0824 0.0842 0.0860 0.0876 0.0892 0.0906 0.0919 00932 
14 0.0677 0.0701 0.0724 0.0745 0.0765 00783 ”0.0801 0.08I7 0.0832 00846 
15 0.0575 0.0602 0.0628 0.0651 0.0673 0.0694 0.0713 0.0731 0.0748 0.0764 
16 0.0476 0.0506 0.0534 0.0560 0.0584 0.0607 0.0628 0.0648 0.0667 00685 
17 0.0379 0.041} 0.0442 0.047} 0.0497 0.0522 0.0546 0.0568 0.0588 00608 
18 0.0283 00318 0.0352 0.0383 0.0412 0.0439 0.0465 0.0489 ”60511 0.0532 
19 0.0188 0.0227 0.0263 0.0296 0.0328 0.0357 0.0385 0.0411 0.0436 00459 
20 0.0094 0.0136 0.0175 002I1 0.0245 0.0277 0.0307 00335 0.0361) 00386 
21 0.0000 0.0045 0.0087 0026 0.0163 0.0197 00229 0.0259 00288 0.0314 
22 a = 0.0000 0.0042 00081 0048 00953 0.0185 005 00244 
23 = == — 一 0.0000 0.0039 00076 00 00143 00174 
24 = = 一 "e E 0.0000 0037 0.0071 0.0104 
25 iE 一 一 一 一 一 一 = 0.0000 0.0035 


来 源 ; 经 Biometrika Trustees 许可 ， 由 Pearson 和 Hartley (1976) 第 二 卷 再 版 修改 而 来 . 


a 表 中 的 数 是 用 由 (6.2.9) 式 给 出 的 Shapiro-Wilk 正 态 性 检验 统计 量 中 的 系数 a. 


0.928 
0.929 
0.929 
0.930 


0.02 
0.756 
0.707 
0.715 
0.743 
0.760 
0.778 
0.791 
0.806 
0.817 
0.828 
0.837 
0.846 
0.855 
0.863 
0.869 
0.874 
0.879 
0.884 
0.888 
0.892 
0.895 
0.898 
0.901 
0.904 
0.906 
0.908 
0.910 
0.912 
0.914 
0.915 
0.917 
0.919 
0.920 
0.922 
0.924 
0.925 
0.927 
0.928 
0.929 


0.930 
0.932 
0.933 
0.934 
0.935 
0.936 
0.937 
0.937 
0.938 


表 A17 Shapiro-Wilk 检验 统计 量 的 分 位 数 ” 


0.05 
0.767 
0.748 
0.762 
0.788 
0.803 
0.818 
0.829 
0.842 
0.850 
0.859 
0.866 
0.874 
0.881 
0.887 
0.892 
0.897 
0.901 
0.905 
0.908 
0.91 | 
0.914 
0.916 
0.918 
0.920 
0.923 
0.924 
0.926 
0.927 
0.929 
0.930 
0.931 
0.933 
0.934 
0.935 
0.936 
0.938 
0.939 
0.940 
0.941 


0.942 
0.943 
0.944 
0.945 
0.945 
0.946 
0.947 
0.947 
0.947 


0.10 
0.789 
0.792 
0.806 
0.826 
0.838 
0.851 
0.859 
0.869 
0.876 
0.883 
0.889 
0.895 
0.901 
0.906 
0.910 
0.914 
0.917 
0.920 
0.923 
0.926 
0.928 
0.930 
0.931 
0.933 
0.935 
0.936 
0.937 
0.939 
0.940 
0.941 
0.942 
0.943 
0.944 
0.945 
0.946 
0.947 
0.948 
0.949 
0.950 


0.951 
0.951 
0.952 
0.953 
0.953 
0.954 
0.954 
0.955 
0.955 


0.50 
0.959 
0.935 
0.927 
0.927 
0.928 
0.932 
0.935 
0.938 
0.940 
0.943 
0.945 
0.947 
0.950 
0.952 
0.954 
0.956 
0.957 
0.959 
0.960 
0.961 
0.962 
0.963 
0.964 
0.965 
0.965 
0.966 
0.966 
0.967 
0.967 
0.968 
0.968 
0.969 
0.969 
0.970 
0.970 
0.971 
0.971 
0.972 
0.972 


0.972 
0.973 
0.973 
0.973 
0.974 
0.974 
0.974 
0.974 
0.974 


0.90 
0.998 
0.987 
0.979 
0.974 
0.972 
0.972 
0.972 
0.972 
0.973 
0.973 
0.974 
0.975 
0.975 
0.976 
0.977 
0.978 
0.978 
0.979 
0.980 
0.980 
0.981 
0.981 
0.981 
0.982 
0.982 
0.982 
0.982 
0.983 
0.983 
0.983 
0.983 
0.983 
0.984 
0.984 
0.984 
0.984 
0.984 
0.985 
0.985 


0.985 
0.985 
0.985 
0.985 
0.985 
0.985 
0.985 
0.985 
0.985 


0.95 
0.999 
0.992 
0.986 
0.981 
0.979 
0.978 
0.978 
0.978 
0.979 
0.979 
0.979 
0.980 
0.980 
0.981 
0.981 
0.982 
0.982 
0.983 
0.983 
0.984 
0.984 
0.984 
0.985 
0.985 
0.985 
0.985 
0.985 
0.985 
0.986 
0.986 
0.986 
0.986 
0.986 
0.986 
0.987 
0.987 
0.987 
0.987 
0.987 


0.987 
0.987 
0.987 
0.988 
0.988 
0.988 
0.988 
0.988 
0.988 


来 源 : 经 Biometrika 委托 许可 由 Pearson 和 Hartley (1976) 再 版 修改 而 来 . 
a 表 中 的 数 是 由 (6. 2.9) 式 给 出 的 Shapiro-Wilk 检验 统计 量 的 疡 分 位 数 w, ， 如 果 五 <wp， 则 以 水 
E a 拒绝 Ho. 


0.98 
1.000 
0.996 
0.991 
0.986 
0.985 
0.984 
0.984 
0.983 
0.984 
0.984 
0.984 
0.984 
0.984 
0.985 
0.985 
0.986 
0.986 
0.986 
0.987 
0.987 
0.987 
0.987 
0.988 
0.988 
0.988 
0.988 
0.988 
0.988 
0.988 
0.988 
0.989 
0.989 
0.989 
0.989 
0.989 
0.989 
0.989 
0.989 
0.989 


0.989 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 


0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.990 
0.991 
0.991 
0.991 


0.991 
0.991 
0.991 
0.991 
0.991 
0.991 
0.991 
0.991 
0.991 
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表 A18 变换 Shapiro-Wilk 统计 量 到 近似 正 态 分 布 的 方法 


n 3 4 5 6 n 3 4 5 6 
v\(d,) (0.7500) (0.6297) (0.5521) (0.4963) v(d,) (0.7500) (0.6297) (0.5521) (0.4963) 

-7.0 一 3.29 一 一 一 2.2 0.52 0.74 0.75 0.64 

一 5.4 一 2.81 一 -一 -一 2.6 0.67 1.00 1.09 1.06 

一 5.0 一 2.68 一 - -一 - 一 3.0 0.81 1.23 1.40 1.45 

一 4.6 一 2.54 -一 一 一 3.4 0.95 1.44 1.67 1.83 

—4.2 -2.40 — -一 — 3.8 1.07 1.65 1.91 2.17 

一 3.8 一 2.25 一 3.50 一 一 4.2 1.19 1.85 2.15 2.50 

一 3.4 一 2.10 一 3.27 一 一 4.6 1.31 2.03 2.47 2.77 

一 3.0 一 1.94 一 3.05 一 4.01 -= 5.0 1.42 2.19 2.85 3.09 

一 2.6 一 1.77 一 2.84 一 3.70 一 5.4 1.52 2.34 3.24 3.54 

一 2.2 — 1.59 一 2.64 一 3.38 = 5.8 1.62 2.48 3.64 — 

一 1.8 — 1.40 =2.44 一 3.11 一 - 6.2 1.72 2.62 -- — 

—1.4 一 人 .21 一 2.22 一 2.87 一 6.6 181 2.75 -一 一 一 

一 1.0 -19l -1.96 一 2.56 一 3.72 7.0 1.90 2.87 一 一 

一 0.6 —0.80 一 1.66 一 2.20 一 2.88 7.4 1.98 2.97 一 一 - 

一 0.2 —0.60 一 1.31 -48l 一 2.27 7.8 2.07 3.08 一 一 
0.2 —0.39 一 0.94 — 1.41 一 1.85 8.2 2.15 3.22 一 一 
0.6 —0.19 一 0.57 一 0.97 一 1.38 8.6 2.23 3.36 一 一 
1.0 0.00 —0.19 —0.51 一 0.84 9.0 2.31 — — — 
1.4 0.18 0.15 一 0.06 一 0.33 9.4 2.38 一 一 
1.8 0.35 0.45 0.37 0.18 9.8 2.45 一 -= 一 

n b, c, d, n b, c, d, 

7 一 2.356 1.245 0.4533 29 - 6.074 1.934 0.1907 
8 一 2.696 1,333 0.4186 30 —6.150 1.949 0.1872 
9 一 2.968 1.400 0.3900 

10 一 3.262 1.471 0.3600 31 — 6.248 1.965 0.1840 

32 一 6.324 1.976 0.1811 

I" 一 3.485 1.515 0.3451 33 —6.402 1.988 0.1781 

12 一 3.731 1.571 0.3270 34 — 6.480 2.000 0.1755 

13 一 3.936 1.613 0.3111 35 — 6.559 2012 0.1727 

14 -4.155 1.655 0.2969 

I5 —4.373 1.695 0.2842 36 一 6.640 2.024 0.1702 

37 一 46.721 2.037 0.1677 

Ié — 4.567 1.724 0.2727 38 —6.803 2.049 0.1656 

I7 一 4.713 1.739 0.2622 39 一 6.887 2.062 0.1633 

18 一 4.885 1.770 0.2528 40 一 6.961 2.075 0.1612 

19 一 5.018 1.786 0.2440 

20 一 5.153 1.802 0.2359 4! — 7.035 2.088 0.1591 

42 一 也 .111 2.101 0.1572 

21 一 5.291 1.818 0.2264 43 —7.188 2.114 0.1552 

22 一 5.413 1.835 0.2207 44 一 7.266 2.128 0.1534 

23 一 5.508 1.848 0.2157 45 一 7.345 2.141 0.1516 

24 — 5.605 1.862 0.2106 

25 — 5.704 1.876 0.2063 46 一 7.414 2.155 0.1499 

47 — 7.484 2.169 0.1482 

26 -5.803 1.890 0.2020 48 一 7.555 2.183 0.1466 

27 一 5.905 1.905 0.1980 49 一 7.615 2.198 0.1451 

28 — 5.988 1.919 0.1943 50 — 7.677 2212 0.1436 


对 3<n<s6， 首 先 计算 v=In[ (7T-d,)/(1 -7)]， 这 里 d, 由 表 的 第 二 行 给 出 ， 了 是 Shapiro-Wilk 检 
验 统计 量 ， 然 后 用 表 中 的 数 fü n 去 求 出 近似 正 态 的 G. 

来 源 ， 经 Biometrika 委托 许可 ， 由 Pearson 和 Hartley(1976) 第 二 卷 再 版 修改 而 来 . 

对 7<n<50， 由 上 表 中 的 n， 找 出 b,，c, 和 d, ， 然 后 计算 


G= ba + cln{(T — dy/(l ~ T) 
它 是 近似 标准 正 态 的 . 
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表 A19 等 样本 容量 的 两 样本 Smirnov 检验 统计 量 的 分 位 数 


— Ay <= w, — m t 


HI 


— O. n , Q 


单 边 检验 : 单 边 检 验 : 
p=0.90 095 0.975 099 0.995 p=0.90 095 0.975 0.99 0.995 
双边 检验 : 双边 检验 : 
p=0.80 0.90 095 098 0.99 p=0.80 090 0.95 0.98 0.99 
2/3 2/3 n = 22 72 8/22 822 10/22 10/22 
3/4 3/4 3/4 23 7/23 8/23 923 10/23 10/23 
3/5 315  4/5 4/5 415 24 7/24 824 9/24 10/24 11/24 
3/6 46 46 5/6 5/6 25 7/25 8/25 9/25 10/25 105 
417 417 5/7 5/7 5/7 26 7/26 826 92 10/26 1026 
4/8 48 58 5/8 6/8 27 7/27 8/27 927 11/27 127 
4/9 5/9 5/9 6/9 6/9 28 8/28 9/28 10/28 11/28 12/28 
4/10 SAO 6I0 bfI0 7/10 29 8/29 929 10/29 11/29 12/29 
SA sl el 7 7111 30 8/30 930 10130 11/30 12/30 
5/12 SA2 612 7R 7N 31 8/31 9/31 10/31 11/31 12/31 
5/13 63 63 73 8/13 32 8/32 932 10/32 12/32 12/32 
5/14 6/l4 7/14 7l4 8/14 33 8/33 933 11/33 12/33 13/33 
5/15 6/15 7/15 8/15 8/15 34 8/34 10/34 11/34 12/34 13/34 
6/16 6116 7/16 8/16 9/16 35 8/35 10/35 11/35 14235 13/35 
6/17 717 7/17 8/17 9/17 36 9/36 10/36 11/36 12/36 13/36 
6/18 7/18 8/18 9/18 9/18 37 9/37 10/37 11/37 13/37 13/37 
6/19 7/119 849 99 9/19 38 9/38 10/38 11/38 13/38 14/38 
6/20 7/20 8/20 9/20 10/20 39 9/39 10/39 11/39 13/39 14/39 
6/21 721 82l 9/21 10/21 40 9/40 10/40 12/40 13/40 14/40 
n> 40 152 LB 192 215 2% 
的 近似 值 Vn Vn Vn Vn Vn 


来 源 ， 经 Institute of Mathematical Statistics 许可 ， 由 Birnbaum 和 和 Hall (1960) 修改 而 来 . 
a 表 中 的 数 是 (6. 3. 1) 式 定义 的 Smirnov 两 样本 双边 检验 统计 量 了 T ( (6.3.2) 和 (6.3.3) 定义 的 
两 样本 单 边 检验 ) 有 选择 的 p 分 位 数 w,， 如 果 统 计量 T 超 过 天 中 给 出 的 1 -a 分 位 数 w-。， 则 以 
水 平 a 拒绝 H,， 检 验 统计 基 是 离散 型 随机 变量 ， 所 以 精确 的 置信 水 平 可 能 小 于 表 中 出 现 的 a. 
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表 A20 不 等 样本 容量 n,m 的 两 样本 Smirnov 检验 统计 量 的 分 位 数 " 


单 边 检验 ; p = 0.90 0.95 0.975 0.99 0.995 
双边 检验 : p = 0.80 0.90 0.95 0.99 0.99 
10 9/10 
N, =2 N, = 3 5/6 
4 3⁄4 
5 415 415 
é 5/6 5/6 
7 5/7 617 
8 3⁄4 7/8 7/8 
9 7/9 8/9 8/9 
10 7/10 415 9/i0 
N=3 N,= 4 3⁄4 3⁄4 
5 2⁄3 4/5 415 
6 2⁄3 2/3 5/6 
7 2/3 5/7 6/7 617 
8 5/8 3⁄4 3⁄4 7/8 
9 2/3 2/3 7/19 8/9 8/9 
10 3⁄5 7/10 415 9/10 9/10 
12 7/12 2/3 3/4 5/6 t1712 
NI=4 N,= 5 3⁄5 3⁄4 4/5 4/5 
6 7112 2/3 3/4 5/6 5/6 
7 17/28 5/7 3/4 6/7 6/7 
8 5/8 5/8 3/4 7/8 7/8 
9 5/9 13 3/4 7/9 8/9 
10 11/20 13/20 70 4/5 4/5 
12 7/12 2⁄3 2/3 3⁄4 5/6 
Ié 9/16 5/8 11/16 3⁄4 13/16 
N =5 N,= é 3⁄5 23 2/3 5/6 5/6 
7 47 23/35 5/7 29/35 677 
8 11/20 5/8 27/40 415 4/5 
9 5/9 3/5 31/45 7/9 415 
10 1/2 3/5 7/10 7/10 415 
15 8/15 3/5 2/3 11/15 1115 
20 1/2 11/20 3/5 7/10 3/4 
N =é N,= 7? 23/42 417 29/42 5/7 5/6 
8 1/2 7/12 2/3 3⁄4 3/4 
9 1/2 5/9 2/3 13/18 7/9 
10 1/2 17/30 19/30 7/10 i1715 
12 1/2 7/12 7/12 2/3 3/4 
18 4/9 5/9 11/18 273 13/18 
24 14/24 1/2 7/12 5/8 3 
N =7 N= 8 27/56 33/56 5/8 41/56 3⁄4 
9 31/63 S/9 40/63 57 47/63 
10 33/70 39/70 43/70 7110 
14 3/7 1/2 417 9/14 5/7 
28 3/7 13/28 15/28 17/28 9114 
N =8 N= 9 4/9 13/24 5/8 23 3/4 
10 19/40 21/40 23/40 27/40 7/10 
i2 11/24 1/2 7/12 5/8 2/3 
16 7/16 1/2 9/16 5/8 5/8 
32 13/32 7/16 1/2 916 19/32 
N =9 N,= 0 7/15 1/2 26/45 2/3 31/45 
12 419 1/2 5/9 11/18 2/3 
i5 19/45 22/45 8/15 3/5 29/45 
18 7/18 419 1/2 5/9 11/18 
36 13/36 5/12 17/36 19/36 5/9 
N = I0 N;= 15 X5 7/15 1/2 17/30 19/30 
20 2/5 9/20 1/2 11/20 3/5 
40 7/20 V5 920 1/2 一 
N,=12 N:=15 23/60 9/20 1/2 11/20 7/12 
16 3/8 7/16 23/48 13/24 7/12 
18 13/36 5/12 17/36 19/36 5/9 
20 11/30 5/12 7/15 31/60 17/30 
N = i5 N, = 20 7/20 2/5 13/30 29/60 31/60 
N = 16 N, = 20 27/80 31/80 17/40 19/40 41/80 
m+n m+n m+n m n 
大 样本 近似 107\ _ 1.22. =- 136\ =s 1.52 _ 1.63 > 


来 源 : 经 Institute of Mathematical Statistics 许可 ， 由 Massey (1952) 修改 而 来 . 

a 表 中 的 数 是 由 (6.3.1), (6.3.2) 和 (6.3.3) 式 定 义 的 Smirnov 两 样本 检验 统计 量 了 7 有 选择 
的 P 分 位 数 w， 令 样本 容量 较 小 的 为 N, ， 样 本 容量 较 大 的 为 N;, ， 如 果 统 计 基 了 超过 表 中 给 出 
的 1 -ea 分 位 数 w _。， 则 以 水 平 e 拒 绝 加 ， 对 于 表 中 没有 包含 的 n 和 m， 使 用 表 中 最 后 一 行 给 
出 的 大 样本 近似 值 , 或 者 对 于 n，m 志 100 的 情形 EAE Harter 和 Owen (1970) 中 由 Kim 和 
Jennrich 制作 的 精确 表 . 
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表 A21 th’ 
自 出 度 

p = 0.6 0.75 0.9 0.95 0.975 0.99 0.995 0.9975 0.999 0.9995 

I 0.325 1.000 3.078 6.314 12.706 31.821 63.657 127.32 38.31 636,62 
2 0.289 0.816 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.598 
3 0.277 0.765 1.638 2.353 3.182 4.54] 5.841 7.453 10.214 12.924 
4 0.271 0.741 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 
5 0.267 0.727 1.476 2015 2.571 3.365 4.032 4.773 5.893 6.869 
6 0.265 0.718 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5,959 
7 0.263 0.71! 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408 
8 0.262 0.706 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041 
9 0.261 0.703 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781 
10 0.260 0.700 1.372 1.812 2.228 2.764 3.169 3.58i 4144 4.587 
II 0.260 0.697 1.363 1.796 2.20! 2.718 3.106 3.497 4.025 4.437 
12 0.259 0.695 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318 
13 0.259 0.694 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221 
l4 0.258 0.692 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140 
t5 0.258 0.691 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073 
16 0.258 0.690 1.377 1,746 2.120 2.583 2.921 3.252 3.686 4015 
17 0.257 0.689 1.333 |.740 2.110 2.567 2.898 3.222 3.646 3.965 
18 0.257 0.688 1.330 1,734 2.101 2552 2.878 3.|97 3.610 3.922 
19 0.257 0.688 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883 
20 0.257 0.687 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850 
21 0.257 0.686 1.323 1.721! 2.080 2.518 2.831 3.135 3.527 3.819 
22 0.256 0.686 1.321 1.717 2.074 2.508 2819 3.119 3.505 3.792 
23 0.256 0.685 1.319 |.714 2.069 2.500 2.807 3.104 3.485 3.767 
24 0.256 0.685 1.318 1,.711 2.064 2.492 2.797 3.091 3.467 3.745 
25 0.256 0.684 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725 
26 0.256 0.684 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707 
27 0.256 0.684 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690 
28 0.256 0.683 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674 
29 0.256 0.683 13Il 1.699 2.045 2.462 2.756 3.038 3.396 3.659 
30 0.256 0.683 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646 
40 0.255 0.681 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.55! 
é0 0.254 0.679 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460 
120 0.254 0.677 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373 
æ 0.253 0.674 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291 


来 源 : 经 Biometrika 委托 许可 ， 由 Pearson 和 Hartley ( 1976 ) 第 一 卷 再 版 修改 而 来 ， 


a 表 中 的 数 是 不 同 自 由 度 下 的 1 分 布 的 p 分 位 数 w, 的 值 ， 对 于 p<0.5, p 分 位 数 w, 可 以 由 式 


Wp 


得 到 ， 注 意 ， 对 所 有 的 白 由 度 ， 有 wo so =0. 


= 一 IDI1_p 
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第 1 章 


1.1 节 1. 10,000; 3. 24; 5. 220; 7. 105; 9. 14; 11. 232/729. 

1.2 1. HHH,HHT,HTH, THH,TTH,THT,HTT,TTT; 3. 0.85; 5. 9/25; 7. 0.007125; 9. 
0.06; 11. 1⁄7; 13. 1⁄4; 15. 4/15; 17. (a)6/1000, #3 个 数字 不 同 ; 3/1000， 若 一 
个 数字 出 现 两 次 ; 或 /1000， 若 一 个 数字 出 现 3 W. (b) E. 

L3% 1. (a)1⁄722, (b)64/729, (c)0, (d)496/729, (e)0, (f)1; 3. (a) 1/128, 
(b)4/128, (c)3/128, (d)1/128, (e)0, (f)1⁄/128, (g)12/128, (h)1; 5. (a)A, 
B, C, D, E, F, (b)P(A) =1/6,P(B) =1⁄6,:--,P(F) =1/6, (c) X(A) =1,X(B) 
=2, Z. 

1.4 节 1. (a)7/6, (b)41⁄36, (c)29/6, (d)1, (e)0.5, (f)1; 3. (a)1⁄2, (b)1⁄2, (c) 
1⁄4, (d)1, (e)0, (f)1⁄2, (g) 1⁄2, (h) Æ; 5. 2211; 7. (a)7/2, (b)35/12, 
(c) 56/3; 9. # = 11, o° =44/3, RË =16; 11. (a) P(X =0) =2/3,P(X=1) = 
1⁄3, (b)0, (c) -1⁄9, (d) -1⁄2; 13. p=13.5, o° = 11.25. 

1.5 节 1. (a)0.5, (b)0.975, (c)0.159, (d)0.682, (e)0.5, (f)0.6745; 3. 0.001; 
5. 207;7. (a)9.488, (b)15.51, (c)233.7; 9. 0.266; 11. <0.0005. 


第 2 章 


2.1 节 1，(a) 美 国 的 所 有 高 中 ，(b) 在 华盛顿 地 区 的 所 有 高 中 ，(c)75 .287.520，(d) 1775 ， 
287 ,520; 3，(a) 有 序 的 ，(b) 所 赢得 奖励 点 的 和 ; 5. 所 有 名 义 的 ; 7. @. 

2.2 节 1. (b) 4300 美元 ,，(c)8600 美元 ，(d)97,296 000 美元 ，(e) 9863.87 美元 ; 3. 12.6, 
12.1,0.5; 5，“ 样 本 值 <c” 的 个 数 /n,1/5; 7. 1005 美元 到 1262 美元 ; 9，0.05 到 
0.55; 11. P(x) =1,x 从 0 到 187; 6/7, x 从 187 到 196; 9/14,x 从 196 到 206; 3/7,x 
从 206 到 210; 3/14,x 从 210 到 273; 0,x 大 于 273. 

2.3 节 1. (a)H,: 新 方法 不 比 现 有 的 方法 好 ，H, : 新 方法 比 现 有 的 方法 好 ，(b) 当 它 不 好 ， 
决定 新 方法 好 的 概率 ,(c) 当 它 是 好 的 ， 决 定 新 方法 好 的 概率 ; 3. (a) 肥 料 B 不 如 肥 
料 A 好 ，(5) 我 的 对 手 是 骗子 ，(c) 太阳 黑子 的 出 现 不 会 影响 经 济 周期 ; 5. 功效 = 
0. 33696; 7. 0.10,0.91. 

2.4 节 1. (a)1⁄342, (b)p’, p>0.5, (d)#t; 5. (a)0.57, (b)1.75. 


第 3 章 


31 f 1. +, T = 0,p = 0.036; 3. (a) 可 能 是 , p = 0.055, (b) (0.15,0.27); 
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5. (0.057,0.437); 7. (a) (0.087,0.491), (b) (0.060,0.440); 9. p = 0.991;11. 

(a) (0.544,0.896), (b) (0.591,0.909). 

3.2 节 1. T, =6,T,=4,p =0.1154; 3. T, =4,p =0.2375; 5 不 , T, =90, T, =90,p = 0.022; 
7. T, =10,p <0. 00001. 

3.3 节 1. (a)77，(b)76.35， 所 以 用 77; 3. (a)15, (b)14.198, FW H 15; 5.26; 
7. (a)94.6% ,95.6% , (b)91.2% ,92. 4% ; 9.210. 

3.4 节 1. T=l,p=0.1094; 3. T=23,p <0.0002; 5. T =60,p =0. 046. 

3.53 1. T, =0.5455,p >0.25; 3. T =7,p =0.0078; 5. T =4,p = 0.006; 7. T = 6, 
p=0.0312; 9. T,=3, n=17,p =0. 0128. 


4.1 节 1. T, =0.800,p =0.424; 3. T, =0.935,p =0.35; 5. T, =1,p =0.005; 7. (a)T, = 
0.8482, AA HAH, p=0.198, (b)T, =1.0599,p=0.145, (c)T;. 

423 1. 2x3 具有 列 总 和 相等 (R =8,R, =10),T=6.3,p <0.05; 3. T=6.81,0.05 <p <0.10, 
对 固定 的 边缘 总 和 ; 5 组 合 C 和 B,T=2.496,0.10 <p <0.25; 7. T =6. 605 ,p >0. 25. 

4.3 节 1， 精 确 地 T=1.10, 近似 地 T=1.20,p >0.25; 3. T =34.875,p <0.001; 5. T = 
5.067 ,0. 05 < p <0. 10. 

4.4 节 1. (a)6.34, (b)0.178, (c)0.0317,(d)0.244, (e)0.0634; (f) 0.1780; 3. (a)R, 
=0.149,p=0.117, (b)0.3636, (c) O. 

453 1. 答案 依赖 于 区 间 的 选择 ; 3. JA 4.2 W, T=19.03,p>0.25; 5. T=4.247,0.10 <p 
<0. 25. 

4.6 节 1. (a) T=4,0.025 <p<0.05, (b)T=4,0.025 <p<0.05，(c) T=2.67,0.10 <p < 
0.25; 3. T=10.4,0.001 < p <0. 005. 
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5.1 节 1. T=117,T'=45, p<0.00]; 3. (0,14); 5. T=24,T'=12,0.05 <p <0.10, 精确 
hb p =4/70 =0. 057. 

5.24 1. T=8.40, p<0.01 从 表 A8, 在 a=0.05 KEF, A 5 B, A 与 C 有 差异 ; 3. 在 
a =0.05 KEF, 最 小 耕作 和 梯田 , 最 小 耕作 和 其 他 , 等 高 地 型 与 梯田 , 等 高 地 型 与 其 
他 有 差异 ; 5， 存 a=0.05 KEF, 除了 B 和 E 外 , 所 有 的 配对 有 差异 . 

5.3 1. T=1107.5,0.05 <p <0.10; 3. T, =5.15,0.05 <p <0. 10. 

5.445 1. (a) -0.603, (b)-0.511, (c)0.05<p<0.10, (d)0.02 <p <0.05; 3. (a) p= 
-0.9025,p <0.001, (b) T= -57,p <0.005; 5. (a)0. 8721,0. 025 <p<0.05, (b) 
0. 7778,0. 025 <p <0.05; 7. N. =98 ,N =27,r= 0. 5680 ,p =0. 014. 

5.54f 1. (b)a=8.69,b=13.6, (d)p = -0.6606,0.02 <p <0.05, (e) (5™™,S™) = 
(10.7.17.4); 3. p= -0.8373,p <0. 001. 

5.6 节 1. (a) 在 中 间 可 能 是 线性 的 , 它 当然 像 单调 的 , (b)46.14, (c)53.51, (d)R (y) = 
0. 4333 +0.9212R (x)， 依 次 连接 (X,Y) = (0.50,0),(0.85,0),(1,2.76),(1.5, 
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5.10 $ 
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11.97) ,(1.94,20) ,(2,21.58) ,(2.5,33.86),(2.75,40) ,(3,46.14) ,(3.5,58. 42 ) ， 
(3.56,60) ,(4,76.06) ,(4.11,80) ,(4.5,89.66) ,(4.92,100) ,(5.00,100); 3. R(y) 
=3. 9375 +0.5625R(x) ， 依 次 连接 (X,Y) =(4.0,0),(4.36,0),(4.4,0.01),(4.7, 
QO) S10 1) (9 3.0 21). (10.7,0 27 CL 0:38) (15.79 0:35). (13:9; 
0.47) ,(15.0,0.54),(15.8,0.60),(17.0,0.67),(18.1,0.74),(19.7,0.80),(19.9, 
0. 87) ,(20.7,0.93),(21.6,1.0). 

l. T=2.988,p =0. 003; 3. T* =39,p=0.50; 5. 5.5 到 7.45,6.5; 7. (a) -18 到 
23, (b)61/64 =95. 3%. 

I. (a)T, =4.43,0.01 <p<0.025， 春 季 与 其 他 三 个 季节 有 差异 ，(b)7T =2.946,0.05 < 
p<0.10，(c) 在 第 一 次 测试 中 ， 较 大 的 医院 有 更 多 的 权重 ; 3. T, =8.328,0.05 < 
p <0.10; 5. T, =4.736,p <0. 0001. 

l. 轮胎 类 型 3 和 6 比 其 他 的 要 好 ， 轮 胎 类 型 5 和 7 比 轮胎 类 型 2 要 好 ; 3. ASHEBA 
1,2 和 4 要 好 ,， 队 3 比 队 1 和 2 要 好 ， 队 4 比 队 2 要好. 

I. T, =7.97,p =0.020， 与 K-W 有 相同 的 差异 ; 3. T, = -2.938,p =0.004; 5. T, = 
1.7140,p =0.043; 7. p= -0. 6925,p 的 绝对 值 较 大 ，P =0. 038 ， 稍 有 些小 . 


5.11 W 1. T, =5,p=6/252 =0.0238; 3. T, =7,p =8/256 =0. 03125. 
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6. 1 节 
6.2 节 


6.3 节 


1. S.(x) +0.509; 3. T=0.425,p>0.20; 5. T=0.492,p <0.01. 
1. T, =0.103,p >0.20; 3. T, =0.9569,p >0.50; 5. T, =0.2155,p=0.20; 7. Z= 
- 1. 9083 ,p =0. 028. 


1. T? =0.8,p=0.40; 3. T, =0.556,0.01 <p<0.05; 5. T, =£ ,p =0. 052. 
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A 
A. R. E. ( asymptotic relative efficiency ) ( #fí VT 
相对 效率 ) 112 
of Cox and Stuart test( Cox 和 Stuart 检 
验 ) ,175 ,323 
of Danicl test( Daniel 检验 ) ,322 
of Durbin test( Durbin 检验 ) ,394 
of Friedman test( Friedman 检验 ) ,379 
of Kendall’s tau( Kendall +) ,327 
of Kruskal-Wallis test ( Kruskal-Wallis 检 
验 ) ,297 
of Mann-Whitney test ( Mann-Whitney 检 
验 ) ,284 
of median test( 中 位 数 检验 ) ,285 ,297 
of paired 1 test( 配对 上 检验 ) ,364 
of Quade test( Quade 检验 ) ,380 
of quantile test vs. one-sample t test( 分 位 
数 检验 对 一 样本 上 检验 ) ,148 
of rank test for siope( 斜率 的 秩 检验 ) ,342 
of sign test( 符号 检验 ) ,363 
of sign test vs. t test( 符 号 检验 与 1 检 
验 ) ,164 ,175 
of sign test vs. Wilcoxon signed ranks test 
(符号 检验 与 Wilcoxon 符号 秩 检验 ) ， 
164,175 
of Spearman’s rho( Spearman p) ,327 
of squared ranks test( 平方 秩 检验 ) ,309 
of two-sample t test( 两 样本 上 检验 ) ,284 
of Wilcoxon signed ranks test ( Wilcoxon 
符号 秩 检验 ) ,363 
acceptance region ( 接受 域 ) ,98 
aligned-rank methods( 秩 排 列 方法 ) ,384 ,385 


alternative hypothesis( 备 择 假设 ) ,95 
alternatives ,ordered( 备 择 的 ,次 序 的 ) ,297 
analysis of covariance ( 方差 分析 ) ,297 
analysis of variance , one-way ( 方差 分析 ,一 种 
方式 ) ,222 ,297 
approximate confidence interval for u(y 的 近似 
置信 区 间 ) ,85 
approximation formulas for tolerance limits ( 容 
忍 限 逼近 公式 ) ,151 ,155 
approximation , normal ( 正 态 B ) : 
to binomial distribution ( 二 项 分 布 ) ,58 
to sum of ranks( 秩 和 ) ,58 
approximations to chi-squared distribution( y 
布 近 似 ) ,62 
asymptotic relative efficiency, (参见 A. R. E. ) 
( 渐 近 相对 效率 ) ,112 
asymptotically distribution-free methods ( šJ 近 
分 布 自由 方法 ) ,117 


B 
biased estimators for e(o 的 有 偏 估计 量 ) ,85 
biased test( 有 偏 检 验 ) ,108 
binomial coefficient( 二 项 系数 ) ,9,11 
binomial distribution{ 二 项 分 布 ) ,28 
mean and variance in( 均值 和 方差 ) ,49 
norma] approximation to( 正 态 通 近 ) ,58 
tables of the( 表格 ) ,513-524 
tests based on the( 基于 .…… 的 检验 ) ,123 
binomial expansion( 二 项 展开 ) ,11 
binomial test( 二 项 检验 ) ,104 ,124 
power of( 功效 ) ,127 
bioassay( 生物 鉴定 ) ,119 
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bivariate random variable( 二 维 随机 变量 ) ,72 

block design, incomplete ( 不 完全 的 区 组 设 
计 ) ,387 

randomized complete (完全 随机 化 )， 
251 ,368 

blocks ,multiple comparisons with complete ( 完 
全 区 组 多 重 比较 ) ,371 ,375 

bootstrap ( 自助 法 ) ,349 

bootstrap method of estimation ( 估计 的 boot- 
strap 方法 ) ,86 


C 
censored data( 删 失 数据 ) ,297 
censored samples( 删 失 样本 ),155 ,285 
central limit theorem( 中 心 极限 定理 ) ,57 ,85 
centroid( 重心 ) .36 
chi-squared approximation to Kruskal-Wallis test 
(x 近似 Kruskal-Wallis 检验 ) ,295 
chi-squared distribution function (y° 分 布 函 数 
的 ),54,59 
approximations to( 通 近 到 ) ,62 
tabjes( 表格 ) ,512 
chi-squared goodness-of-fit testy 拟 合 优 度 检 
验 ) ,239 ,240 ,429 ,430 ,442 ,443 
chi-squared random variables, sum of (x 随机 
变量 的 和 ) ,62 
chi-squared test( 检验 ) : 
for differences in probabilities (概率 差 
异 ) ,180 ,199 
with fixed marginal totals ( 固定 边缘 总 
和 ) ,209 
for independence( 独立 性 ) ,204 
circular distributions( 圆周 分 布 ) ,285 ,364 
cluster analysis( 聚 类 分 析 ) ,419 
Cochran test( Cochran 检验 ) ,250 
Cochran's criteria for small expected values( 对 
小 期 望 值 的 Cochran 准则 ) ,202 
coefficient ,binomial( 系数 ,二 项 ) ,9,11 
confidence( 置信 ) ,83 


multinomial( 多 项 式 ) ,9 ,12 
coefficient of concordance , Kendall’s ( Kendall 
一 致 性 系数 ) ,328 ,380 
comparisons , multiple( 多 重 对 比 ) : 
with complete blocks( 完全 区 组 ) ,371 ,375 
incomplete blocks{ 不 完全 区 组 ) ,390 
with independent samples (独立 样本 )， 
290 ,297 ,398 
in test for variances( 方差 检验 ) ,304 
complete block design , randomized ( 随机 化 完 
全 区 组 设计 ) ,368 
completely randomized design( 完全 随机 化 设 
计 ) ,222 
composite hypothesis( 复合 假设 ) ,97 
computer simulation to find null distribution( H 
算 机 模拟 求 零 假 设 分 布 ) ,446 ,447 
concordance between blocked rankings( 区 组 秩 
间 的 一 致 性 ) ,385 
concordance , Kendall’s coefficient of ( Kendall 
系数 一 致 性 ) ,328 ,382 
concordant pairs( 不 和 谐 配对 ) ,319 
conditional probability( 条 件 概率 ) ,17 ,23 ,24 
conditional probability function (条 件 概率 函 
数 ) ,29 
confidence band for a distribution function ( 分 
布 函 数 置 信和 界 ) ,438 
confidence coefficient{ 置信 系数 ) ,83 ,129 ,143 
confidence interval( 系数 ,区 间 ) ,83 ,114 ,129 
for the difference between two means ( 两 
均值 差异 ) ,281 
for a mean ,parametric( 均值 ,参数 ) ,149 
for the median difference( 中 位 差异 ) ,360 
for u ,approximate( X} F p, iH if ) ,85 
for a probability or population proportion 
( 对 于 概率 或 总 体 比 例 ) ,130 
exact tables for( 精确 表格 ) ,525-536 
for a guantile( 分 位 数 ) ,135 ,143 
one-sided( 单 边 ) ,153 
for a slope( 斜率 ) ,335 
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conservative test( 保守 检验 ) ,113 
consistent( 相合 的 ) ,117 
consistent sequence of tests( 检验 的 相合 序 
列 ) , 106 ,108 ,160 
consistent ,sign test( 相合 ,符号 检验 ) ,163 
contingency coefficient( 列 联 系数 ) : 
Cramér's( Cramér ) ,229 
Pearson's( Pearson) ,231 
Pearson's mean square ( Pearson 均值 平 
J) ,231 
contingency table( 列 联 表 ) ,166 ,179 ,199 ,292 
fourfold( 四 重 的 ) ,180 
multi-dimensional( 多 维 的 ) ,215 
rxc(rxc E) ,199 
three-way( 三 种 方式 的 ) ,214 
two-way( 两 种 方式 的 ) ,214 
continuity correction ( 连续 修正 ),126, 127, 
135 .138 ,159 ,190 ,192 ,194 ,195 
in Kendall's tau( Kendall’s z) ,322 
in Mann-Whitney test ( Mann-Whitney 检 
验 ) ,274 ,275 
in Wilcoxon signed ranks test ( Wilcoxon 
符号 秩 检 验 ) ,359 
continuous distribution function (连续 分 布 PŘ 
数 ) ,53 
continuous random variable (连续 型 随机 恋 
HL) ,$2 ,S3 
control, sign test for comparing several treat- 
ments with a( 带 控制 的 几 种 处 理 比较 的 符 
号 检验 ) ,175 
convenience sample( 方便 样本 ) ,69 
correction for continuity ( 连续 修正 ),126,127， 
135 ,138 ,159 ,190 ,192 ,194 ,195 
correction ,Sheppard's( Sheppard 修正 ) ,248 
correlation( 相关 性 ) : 
quick test for( 快速 检验 ) ,196 
rank( 秩 ) ,312 
sign test for( 符号 检验 ) ,172 
correlation coefficient( 相关 系数 ) ; 


Kendall's partial( Kendall 偏 ) ,327 
Kendall's rank ( Kendall 秩 ), 318, 319, 
325 ,326 
Pearson’s product moment ( Pearson 3⁄ $R 
ZE ) 313,318 
Spearman’s rank ( Spearman 秩 ) 314, 
325 ,326 
correlation coefficient between two random vari- 
ables ( 两 随机 变量 的 相关 系数 ) ,43 
correlation test( 相关 性 检验 ): 
Kendall’s rank( Kendal! 秩 ) ,175 ,321 
Spearman’s rank( Spearman 秩 ) ,175 ,316 
counting rules{ 计数 法 则 ) ,5 
covariance( 协 方 差 ) ,39 
analysis of ( 分 析 ) ,297 
of two random variables ( 两 随机 变量 ) , 
41 ,42 ,46 
of two ranks( 两 秩 ) ,45 
Cox and Stuart test for trend( Cox 和 Stuart 趋 
势 检 验 ) ,169 ,170 
A. R. E. of( A. R. E. 的 ) ,175 
Cramér’s coefficient ( Cramér 系数 ) ,230 ,234 
Cramér's contingency coefficient ( Cramér 列 联 
系数 ) ,229 
Cramér-von Mises goodness-of-fit test ( Cramer - 
von Mises 拟 合 优 度 检验 ) ,441 
Cramér-von Mises two-sample test ( Cramér’-von 
Mises 两 样本 检验 ) ,463 
tables for( 表格 ) ,464 
critical region( 临界 区 域 ) ,97 ,98 ,101 
size of( 大 小 ) ,100 
curves , Survival{ 生存 曲线 ) ,119 


pD 

Daniel's test for trend( Daniel 趋势 检验 ) ,323 
decile, (十 分 位 数 (的 )) 33 ,34 

decision rule{ 决策 法 则 ) ,98 

degrees of freedom( 自由 度 ) ,59 
dependence , measure of( 相依 性 度量 ) ,227 
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design( 设计 ) ; 
completely randomized( 完全 随机 化 ) ,222 
experimenta] ( 经 验 ) ,419 
incomplete block( 不 完全 区 组 ) ,387 
randomized complete block ( 随机 化 完全 
区 组 ) ,368 
deviates ,random normal( 正 态 随机 偏离 ) ,404 
difference between two means ,confidence interval 
for the( 两 均值 差异 的 置信 区 间 ) ,281 
difference, confidence interval for the median 
(中 位 数 差异 置信 区 间 ) ,360 
discordant pairs{ 不 种 谐 配 对 ) ,319 
discrete distribution function ( $ # 4) 4 PA 
数 ) ,52 
discrete random variable{ 离散 型 随机 变量 ) ,52 
discrete uniform distribution ( 离散 均匀 分 布 ) ， 
28 ,437 
discriminant analysis( 判别 分 析 ) ,119 ,419 
dispersion ,sign test for trends in( 散布 趋 势 的 
符号 检验 ) ,175 
distribution ( 分 布 ) : 
binomial( 二 项 ) ,27 
discrete uniform( 离散 均匀 ) ,28 
exponential( 指数 ) ,447 
hypergeometric( 超 几 何 分 布 ) ,30 
lognormal( 对 数 正 态 分 布 ) ,453 
nujl( Z) ,99 
uniform( JJ) ,433 
distribution-free( 分 布 自 由 ),114 
distribution-free methods , asymptotically ( # 近 
的 分 布 自由 方法 ) ,117 
distribution function( 445 PRAX ) ,26 
chi-squared (x ) ,54 ,59 
confidence band for( 置信 和 界 ) ,438 
continuous( 连续 ) ,53 
discrete( 离散 ) ,52 
empirical( 经 验 ) ,79 ,428 
joint( 联合 ) ,29 
normal( 正 态 ) ,34 ,55 


of order statistics ( 次 序 统 计量 ), 146, 
147 ,153 
sample( 样本 ) ,79 ,80 
distributions with heavy tails( 重 尾 分 布 ) ,116， 
148 ,164 
distributions with light tails ( 轻 尾 分 布 )， 
116 ,164 
dose-response curves{ 剂量 响应 曲线 ) ,349 
Durbin test( Durbin 检验 ) ,387 ,388 
efficiency of( 效率 ) ,394 


E 
efficiency ( 效率 ) , 106 
asymptotic( 渐 近 的 ) ,112 
of the Durbin test{ Durbin 检验 ) ,394 
of the Friedman test( Friedman 检验 ) ,379 
of the paired t-test( 配对 上 检验 的 ) ,364 
relative( 相关 的 ) ,110,111 ,112 
of the sign test( 符号 检验 ) ,364 
of the Smirnov test( Smirnov 检验 ) ,465 
of the Wilcoxon test( Wilcoxon 检验 ) ,364 
empirical distribution function (经 验 分 布 函 
k) ,79 ,428 
empirical survival function( 经 验 生 存 醒 数 ) ,89 
empty set( 空 集 ) ,14 
error( 误差 ) : 
standard( 标准 ) ,85 ,88 
type l| ( 12) ,98 
type II ( ll Æ) ,98 ,99 
estimate( 估计 ): 
interval( 区 间 ) ,83 
point( 点 ) ,83 
of the standard deviation( 标准 差 ) ,443 
estimation( 估计 ) ,79 ,88 
of parameters in chi-squared goodness-of- 
fit test (参数 xX 拟 合 检验 ), 243, 
245 ,249 
estimator( 估计 量 ) ,79 ,81 
of population mean( 样本 均值 ) ,115 
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of population standard deviation ( 样本 标 
准 差 ) ,115 
unbiased( 无 偏 ) ,74 
for y(u) ,84 
for o° (a°) ,85 

event( 事件 ),7,14 

probability of( 概率 ) ,14 

sure( 必然 ) ,14 
events ,independent{ 事件 ,独立 ) ,18 ,19 

joint( 联合 ) ,17 

mutually exclusive( 互 不 相 容 ) ,19 
exact test, Fisher's( 精确 检验 ,Fisher) ,188 ,213 
exclusive ,mutually( 互 不 相 容 ) ,14 
expected normal scores( 期 望 正 态 得 分 ) ,404 
expected value( 期 望 ( 值 ) ) ,35 ,39 
expected values ,small( 小 期 望 ( 值 )): 

in contingency tables( 列 联 表 ) ,201 ,220 

in goodness-of-fit test( 拟 合 优 度 检验 )， 

241 ,249 

experiment( 试验 ) ,6 ,69 
experimental design( 试验 设计 ) ,419 
experiments ,independent( 独立 试验 ) ,15 ,19 ,20 
exponential distribution( 指数 分 布 ) ,447 

Lilliefors test for the( Lilliefors 检验 ) ,448 
extension of the median test( 中 位 数 检验 的 扩 

展 ) ,224 


F 
Fdistribution( F 分布 ): 
in Friedman test( Friedman 检验 ) ,370 
in incomplete block analysis ( 不 完全 区 组 
分 析 ) ,389 
in Quade test( Quade 检验 ) ,374 
table of the( 表格 ) ,562-571 
F statistic( F thf ) ,227 ,258 ,418 
computed on scores( 得 分 计算 ) ,312 
F test( 下 检验 ) ,297 ,300 
for equal variances( 等 方差 ) ,308 ,309 
for randomized complete blocks ( 随机 完 


全 区 组 ) ,379 
factorial notation( 阶乘 记号 ) ,8 
families of distributions ,goodness-of-fit tests for 
(分 布 族 的 拟 合 优 度 检验 ) ,442 
Fisher's( Fisher) : 
exact test( 精确 检验 ) ,188 ,213 
least significant difference ( 最 小 显著 差 
异 ) ,296 
LSD procedure on ranks (有关 秩 的 LSD 
方法 ) ,379 
method of randomization ( 随机 化 方法 ) ,407 
four-fold contingency table( 四 重 列 联 表 ) ,180， 
233 
freedom ,degrees of( 自由 度 ) ,59 
Friedman test( Friedman 检验 ) ,367 ,369 
efficiency of( 效率 ) ,379 
extension of ( 推广 ) ,383 
function( PK% ) : 
distribution( 分 布 ) ,26 
power( 功效 ) ,163 
probability ,of a random variable ( 随机 变 


量 的 概率 ) ,25 
probability ,on a sample space( 样本 空间 
的 概率 ) ,15 


random( 随机 ) ,80 
step( 阶梯 ) ,52 
survival( 生存 ) ,89 


G 

gamma coefficient( gamma 系数 ) ,320 

goodness-of-fit test( 拟 合 优 度 检验 ) : 
chi-squared (x° ) ,239 ,240 
Cramér-von Mises{ Cramér-von Mises) ,441 
Kolmogorov ( Kolmogorov ) ,428 ,430 ,435 

goodness-of-fit tests for families of distributions 

(分 布 族 拟 合 优 度 检验 ) ,442 

grand median{ 全 中 位 数 ) ,218 

H 

heavy tails ,distributions with( 重 尾 分 布 ) ,116， 


148 ,164 
Hodges-Lehman estimate of shift( Hodges-Leh- 
man 漂移 估计 ) ,282 ,361 
hypergeometric distribution( 超 几 何 分 布 ) ,30， 
188,191 
mean of( 均值 ) ,188 ,191 
standard deviation of( 标准 差 ) ,188 ,191 
hypothesis( 假设 ) : 
alternative( 备 择 的 ) ,95 
composite( 复合 的 ) ,97 
null( 零 ) ,95 
simple( 简单 ) ,97 
testing( 检验 ) ,95 
tests ,properties of( 检验 ,性质 ) ,106 


I 
incomplete block design (不 完全 区 组 设计 )， 
368 ,387 
incomplete blocks, multiple comparisons ( 不 完 
全 区 组 的 多 重 比较 ) ,390 
independence ,the chi-squared test for( 独立 ,x 
检验 ) ,204 
independent( 独立 ) : 
events( 事件 ) ,18 ,19 
experiments( 试验 ) ,15 ,19 ,20 
random variables( 随机 变量 ) ,31 ,46 ,72 
samples , multiple comparisons with( 样本 , 
多 重 比较 ) ,290 ,297 ,398 
samples ,randomization test for two( 样本 ， 
随机 化 检验 ) ,409 
inference , statistical ( 统计 推断 ) ,68 
interaction( Z H.) : 
rank transformation test for( 秩 变换 检 
验 ) ,419 
test for( 检验 ) ,384 
intercept( 截 距 ) ,333 
interquartile range( 四 分 位 数 极 差 ) ,37 
interval ,confidence( 置信 区 间 ) ,83 
interval estimate( 区 间 估 计 ) ,83 ,129 
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interval scale of measurement ( 测量 的 区 间 尺 
FE) ,74 


J 

joint distribution function ( EK & 4) ff A% ), 
28,29 

joint event ( 联合 事件 ) ,17 

joint probability function( KARE AX) ,28 

Jonckheere-Terpstra test for ordered alternatives 
( Jonckheere-Terpstra 顺序 备 择 检验 ) ,325 


K 
Kaplan-Meier estimator ( Kaplan-Meier 估 计 
量 ) ,89 
Kendall's( Kendall ) : 
coefficient of concordance (一 致 性 系 
数 ) ,328 
partial correlation coefficient ( 偏 相 关系 
数 ) ,327 
rank correlation test( 秩 相 关 检 验 ) ,175 ,321 
tau (7),318,319,325 ,326 ,335 
exact tables( 精确 表 ) ,545-546 
tau(7) ,A. R. E. of,327 
tau for ordered alternatives( 顺序 备 择 +) ,381 
Klotz test( Klotz 检验 ) ,401 
Kolmogorov goodness-of-fit test ( Kolmogorov 
拟 合 优 度 检 验 ) ,428 ,430 
exact tables( 精确 表 ) ,549 
Kolmogorov goodness-of-fit test for discrete 
distributions ( 离散 分 布 的 Kolmogorov 拟 合 
优 度 检验 ) ,435 
Kolmogorov-Smirnov tests ( Kolmogorov-Smirnov 
检验 ) ,428 
Kruskal-Wallis test( Kruskal-Wallis 检验 ) ,288 
exact tables for( 精确 表 ) ,541 


L 
least significant difference , Fisher's ( 最 小 显著 
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差异 ,Fisher) ,296 
least squares estimates( 最 小 二 乘 估计 ) ,334 
least squares method( 最 小 二 乘 方法 ) ,333 
Let's make a deal( 让 我 们 和 ……: 妥协 ) ,66 
level of significance( 显著 水 平 ) ,99 
life testing( 寿命 检验 ) ,148 
light tails, distributions with( 轻 尾 分 布 )， 
116,164 
likelihood ratio statistic( 似 然 比 统计 量 ) ,258 
likelihood ratio test( 似 然 比 检验 ) ,259 
Liliefors test for the exponential distribution( 指 
数 分 布 的 Liliefors 检验 ) ,448 
table( 表格 ) ,551 
Liliefors test for normality ( Liliefors 正 态 性 检 
验 ) ,443 
tables( 表格 ) ,550 
limits ,tolerance( 容忍 限 ) ,150 
linear regression ( 线性 回归 ) ,333 
location estimates, robust ( 位置 估计 , 稳 
健 ) ,362 
location , measure of( 位置 ,度量 ) ,36 
loglinear models( 对 数 线性 模型 ) ,215 ,259 
lognormal distribution( 对 数 正 态 分 布 ) ,453 
longitudinal studies( 纵向 研究 ) ,119 
lottery game ,Texas Lotto( Texas 彩票 游戏 ) ,66 
lower-tailed test( 左边 检验 ) ,98 


M 
Mann-Whitney test ( Mann-Whitney 检验 )， 
103 ,203 ,271 
tables( 表格 ) ,538-540 


Mantel-Haenszel test ( Mantel-Haenszel 检 


验 ) ,192 
marginal totals , chi-squared test with fixed ( 
定 边缘 和 的 x 检验 ) ,209 


matched pairs( 配对 ) ,350 
randomization test fort 随机 化 检验 ) ,412 
McNemar test( McNemar 检验 ) ,166 ,180 ,252 ， 
255 ,256 


compared with paired t test( 与 配对 上 检验 
比较 ) ,178 
mean( 均值 ) ,36,51 
of hypergeometric distribution ( 超 几 何 分 
布 ) ,188 ,191 
population ,estimator of( 总 体 估 计量 ) ,115 
in rank test using scores( 得 分 的 秩 检验 ) ， 
306 
sample( 样本 ) ,81 ,83 
of sum of random variables ( 随机 变量 
和 ) ,39 
of sum of ranks( 秩 和 ) ,41 ,49 
and variance in binomial distribution( 二 项 
分 布 的 方差 ) ,49 
means( 均值 ) : 
confidence interval for the difference be- 
tween two( 两 差异 的 置信 区 间 ) ,281 
sign test for equal (对 相等 的 符号 检 
验 ) ,160 
measurement scale{ 度量 尺度 ) ,73 
interval( 区 间 ) ,74 
nominal( 名 义 ) ,73 
ordinal( 有 序 的 ) ,74 
ratio( 比率 ) ,75 
measures of dependence( 相依 度量 ) ,227 
median( 中 位 数 ) ,33 ,34 
difference , confidence interval for ( 差异 ， 
置信 区 间 ) ,360 
grand( 总 的 ) ,218 
sample ( 样本) ,82 
test ( 检验 ) ,218 ,352 ,355 
comparison with Kruskal-Wallis test 
(与 Kmskal-Wallis 检验 的 比较 ) ,291 
an extension of( 一 个 推广 ) ,224 
medians ,sign test for equal( 对 相等 中 位 数 的 
符号 检验 ) ,160 
meta-analysis( meta- 分 析 ) ,452 
minimum chi-squared method ( 最 小 x 距离 方 
法 ) ,243 ,245 


Minitab( Minitab) ,91 ,107 ,127 ,130 ,139 144, 
161 ,182 ,201 , 205,210,220 ,241 ,276 ,282， 
290 ,318 , 322 , 328 , 336 , 355 , 361 , 371 , 382, 
390 .444 ,451 

model( 模型 ) ,6 

models ,loglinear( 对 数 线性 模型 ) ,215 ,259 

monotonic regression{ 单调 回归 ) ,344 

Mood test for variances ( Mood 方差 检验 )， 
309,312 

multi-dimensional contingency table ( 多 维 列 联 
表 ) ,215 

multinomial( 多 项 式 的 ): 

coefficient( 系数 ) ,9,12 

distribution{ 分 布 ) ,203 ,207 ,249 

proportions , simultaneous confidence inter- 
vals for( 比例 ,联合 置信 区 间 ) ,133 

multiple comparisons( 多 重 比较 ) : 

complete blocks design( 完全 区 组 设计 ) ， 
371,375 

incomplete blocks design ( 不 完全 区 组 设 
计 ),390 

independent samples (独立 样本 ),290,， 
297 ,398 

in one-way layout (以 一 种 方式 设计 )， 
220 ,222 ,252 

variance( 方差 ) ,304 

multiple regression( 多 元 回归 ) ,419 

multivariate data ,randomization test for( 多 元 数 
据 的 随机 化 检验 ) ,416 

multivariate observations( 多 元 观察 ) ,385 

multivariate random variable( 多 元 随机 变量 )， 
71,72 

confidence region for (置信 区 间 )， 
362 ,364 
mutually exciusive( 互 不 相 容 ) ,14 
events( 事件 ) ,19 


N 
nominal scale data( 名 义 尺 度数 据 ) ,117 ,118 
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nominal scale of measurement ( 测量 的 名 义 尺 
度 ) ,73 
nonparametric methods( 非 参数 方法 ) ,116 
nonparametric statistics( 非 参 数 统计 ) ,2,114 
definition( 定义 ) ,118 
normal approximation ( 正 态 通 近 ) : 
to binomial distribution( 二 项 分 布 ) ,58 
to chi-squared distribution(x 分 布 ) ,62 
to hypergeometric ( 超 几 何 ) ,188 ,194 
in Mann-Whitney test ( Mann-Whitney 检 
验 ) ,237 ,281 
in squared ranks test ( 秩 平 方 检验 )， 
301 ,302 
to sum of ranks( 秩 和 ) ,58 
in Wilcoxon signed ranks test( Wilcoxon 
秩 和 检验 ) ,353 ,359 
normal deviates , random ( 随机 正 态 偏差 ) ,404 
normal distribution function ( IF 54 i PRX), 
54,55 
standard ( 标准 正 态 分 布 函 数 ) ,55 
tables of( 标准 正 态 分 布 国 数 表 ) 508-511 
normal scores{ 标准 得 分 ) ,396 
expected( 期 望 的 ) ,404 
in matched pairs test( 配对 检验 ) ,400 
in one-way layout( 以 一 种 方式 设计 ) ,397 
in test for correlation( 相关 检验 ) ,403 
in test for variances( 方差 检验 ) ,401 
in two-way layout( 以 两 种 方式 设计 ) ,403 
normality( 正 态 ) : 
Lilliefors test for( Lilliefors 正 态 检 验 ) ,443 
Shapiro-Wilk test for ( Shapiro-Wilk 检 
验 ) ,450 
normalized sample ( 标准 化 样本 ) ,443 
null distribution( 零 分 布 ) ,99 
null hypothesis( 零 假设 ) ,96 


O 
one-sample case( 一 样本 情形 ) ,350 
one-sample t-test( 一 样本 上 检验 ) ,363 ,418 
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one-tailed test( 单 边 检验 ) ,98 
one-to-one correspondence( 一 一 对 应 ) ,52 
one-way analysis of variance( 一 种 方式 的 方差 
分 析 ) ,222 ,297 
one-way layout( 一 种 方式 的 设计 ) ,227 
order statistic of rank k( 秩 大 的 次 序 统 计量 ) ， 
77 ,82 
order statistics{ 次 序 统计 量 ) ,143 
distribution function of ( 4 #5 PAX ) ,146， 
147 ,153 
ordered alternatives ( 有 序 备 择 ) ,297 ,385 
Jonckheere-Terpstra test for ( Jonckheere- 
Terpstra 检验 ) ,325 
Page test for( Page 检验 ) ,380 
ordered categories ,analysis of contingency table 
with( 有 序 分 类 的 列 联 表 分 析 ) ,292 
ordered observation( 次 序 观 察 ) ,77 
ordered random sample( 次 序 随机 样本 ) ,77 
ordinal data( 有 序数 据 ) ,117 ,118 ,271 ,272 
ordinal scale of measurement ( 测量 的 顺序 尺 
BE) ,74 
outcomes( 结果 ) ,6 
outliers ( 离 群 值 ) ,117 ,284 ,297 


P 
p-value(p- 值 ) ,101 
Page test for ordered alternatives( 有 序 备 择 的 
Page 检验 ) ,380 
paired t test( 配对 上 检验 ) ,363 
efficiency of( 效率 ) ,364 
McNemar test compared with ( McNemar 
检验 的 比较 ) ,178 
parallelism of two regression lines( 两 回归 直线 
的 平行 ) ,364 
parameter estimation( 参数 估计 ) ,88 
parametric confidence interval for mean( 均值 的 
参数 置信 和 区间) ,149 
parametric methods( 参数 方法 ) ,115 
parametric statistics( 参数 统计 ) ,2,114 


partial correlation coefficient( 偏 相 关系 数 ) : 
Kendall's( Kendall ) ,327 
Spearman’s( Spearman ) ,328 
PASS ,107 
Pearson product moment correlation coefficient 
( Pearson 乘积 矩 相 关系 数 ) ,234 ,239 
Pearson's( Pearson) 
contingency coefficient( 列 联系 数 ) ,231 
mean-square contingency coefficient( 均 方 
列 联系 数 ) ,231 
product moment correlation coefficient ( F FRE 
相关 系数 ) ,313 ,318 
percentile( 百 分 位 点 ) ,33 ,34 
phi coefficient( phi 系数 ) ,234 ,239 
Pitman's efficiency( Pitman 有 效 性 ) ,112 
point estimate( 点 估计 ) ,83 
point in the sample space( 样本 空间 中 的 点 ) ,13 
population( 总 体 ) ,68 ,69 
sampled( 抽样 ) ,69 ,70 
target( 目标 ) ,69 ,70 
power( 功效 ) ,3 ,100 ,106 ,116 
of the binomial test( 二 项 检验 ) ,127 
function( PŽ) ,106 ,163 
probabilities , chi-squared test for differences in 
(概率 差异 的 x 检验 ) ,180 ,199 
probability( 概率 ) ,5 ,13 
conditional( 条 件 的 ) ,17 ,23 
confidence interval for( 置信 区 间 ) ,130 
of the event( 事件 ) ,14 
function ( K% ) ,15 
conditional ( 条 件 的 ) ,29 
joint( 联合 ) ,28 
of the point( 点 的 ) ,14 
sample( 样本 ) ,69 
properties of random variables ( 随机 变量 的 性 
质 ) ,33 
proportion, confidence interval for population 


(比例 ,总 体 的 置信 区 间 ) ,130 


Q 
Quade test( Quade 检验 ) ,367 ,373 
efficiency of( 效率 ) ,380 
power of( 功效 ) ,380 
quantile( 分 位 数 ) ,27 ,33 ,34 
confidence interval for (置信 和 区间)， 
135 ,143 
population( 总 体 ) ,136 
sample( 样本 ) ,81 
test( 检验 ) ,135 ,136 ,222 
A . R. E. vs. one-sample t test( A. R. 
E. 与 一 样本 上 检验 ) ,148 
quartile( 四 分 位 数 ) ,33 ,34 


R 
random function( FE HL pR #& ) ,80 
random normal deviates( 随机 正 态 偏差 ) ,404 
random sample( 随机 样本 ) ,69 ,70 ,71 
random variable{ 随机 变量 ) ,22 ,23 ,76 
bivariate( 二 维 ) ,72 
continuous( 连续 ) ,52 ,53 
discrete( 离散 ) ,52 
distribution function of( 44i PA% ) ,26 
multivariate( 多 元 ) ,71 ,72 
probability function of( 概率 函数 ) ,25 
random variables( 随机 宏 量 ) : 
correlation coefficient between two ( 两 随 
机 变量 的 相关 系数 ) ,43 
covariance of two (两 随机 变量 的 协 方 
差 ) ,41 ,42 ,46 
independent( 独立 ) ,31 ,46 ,72 
properties of( 性 质 ) ,33 
randomization , Fisher's method of ( 随机 化 的 
Fisher 方法 ) ,407 
randomization test for two independent samples 
(两 独立 样本 的 随机 化 检验 ) ,409 
randomized complete block design( 随机 化 完全 
区 组 设计 ) ,251 ,368 
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randomness , test for( 随机 检验 ) ,242 
range( 极 差 ) ,37 
interquartile ( 四 分 位 数 间 的 ) ,37 
rank correlation( 秩 相 关 ) ,312 
Kendall's test for( Kendall 检验 ) ,175 ,321 
Spearman’s test for ( Spearman 检验 )， 
175,316 
rank of an order statistic ( 次 序 统计 量 的 秩 ) ,77 
rank transformation( 秩 变换 ) ,417 
ranks( 秩 ) : 
covariance of two ( 两 随机 变量 的 协 方 
差 ) ,45 
mean of sum of( 和 的 均值 ) ,41 ,49 
normal approximation to sum of( 和 的 正 
态 近 似 ) ,58 
variance of sum of( 和 的 方差 ) ,48 ,49 
ratio scale of measurement( 测量 的 比率 尺度 ) ， 
75 
region( BR) : 
acceptance ( 接受 ) ,98 
critical( 临界 ) ,97 ,98 ,101 
rejection ( 拒绝 ) ,98 
regression( 回归 ) ,328 ,332 
equation( 方程 ) ,332 
linear( 线性 ) ,333 
monotonic{ 单调 ) ,344 
multiple ( 多 元 ) ,419 
parallelism of two lines( 两 线 平行 ) ,364 
rejection region( 拒绝 域 ) ,98 
relative efficiency( 相对 效率 ) ,110,111 ,112 
asymptotic( 渐 近 ) ,112 
Resampling Stats ,88 
research hypothesis( 假设 研究 ) ,95 
rho, Spearman’s ( p, Spearman ) 314, 325, 
326,335 
relationship with Friedman’s test ( 与 Fried- 
man 检验 的 关系 ) ,382 
robust( 稳健 ) ,419 ,420 
location estimates( 局 部 估计 ) ,362 
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methods( 方法 ) ,115,119 
runs tests( 游 动 检 验 ) ,3 


S 
S -Plus, 88, 91, 127, 130, 168, 182, 189 193, 
201 ,205 ,210 ,241 ,276 ,290 ,318 ,322 ,355, 
371 .432 ,444 ,449 
sample( 样本 ) ,68 ,69 
censored( BJ: ) ,155 ,285 
convenience( 方便 ) ,69 
distribution function( 分 布 琐 数 ) ,79 ,80 
mean( 均值 》,81 ,83 
mean, unbiased for u ( ËJ (Ë. X} u X 
偏 ) ,84 
median( 中 位 数 ) ,82 
normalized( 正则 化 ) ,443 
probability ( 概率 ) ,69 
quantile( 分 位 数 ) ,81 
sequential ( 序 贯 ) ,362 
space( 空间 ) ,13 
point in the( 样本 空间 中 的 点 ) ,13 
standard deviation ( 标准 差 ) ,83 
variance( 方差 ) ,81 ,83 
unbiased for o` ( X} o° 无 偏 ) ,85 
sampled population ( 抽样 总 体 ) ,69 ,70 
SAS, 168, 182, 189, 193. 201, 205, 210 , 230, 
259 276 ,290 ,322 ,325.,355,371 ,390 ,451 
scale , measure of( 度量 ,刻度 ( 尺度) ) ,37 
scale ,tests for( 刻度 ,检验 ) ,309 ,310 
scales ,measurement( 刻度 ,测量 ) ,73 
scores( 得 分 ) ,306 
expected normal( 期 望 正 态 ) ,404 
F statistic computed on (计算 下 统计 
量 ) ,312 
mean in rank test using (均值 的 秩 检 
验 ) ,306 
normal( 正 态 ) ,396 
variance in rank test using (方差 的 秩 检 
验 ) ,307 


sequential sampling( 序 贯 抽样 ) ,362 
sequential testing( 序 扣 检验 ) ,285 
set empty ( 空 集 ) ,14 
Shapiro-Wilk test for normality ( Shapiro-Wilk 
正 态 检 验 ) ,450 
tables( 表 ) ,552-557 
Sheppard’s correction( Sheppard 相关 ) ,248 
Siegel-Tukey test( Siegel-Tukey 检验 ) ,312 
sign test( 符号 检验 ) ,157 
consistent( 相合 ) ,163 
for correlation ( 相关 性 ) ,172 
efficiency of( 效率 ) ,364 
for equal means{ 等 均值 ) ,160 
for equal medians( 等 中 位 数 ) ,160 
extension to k samples of (推广 到 大 样 
本 ) ,367 
unbiased( 无 偏 ) ,163 
variations of{ 方差 ) ,166 ,175 
vS. test, A. R. E. of (与 1 检验 的 A. R. 
E. ) ,164 ,175 
vs. Wilcoxon signed ranks test, A. R. E of 
(5 Wilcoxon 符号 秩 检 验 的 A. R. 
E. ) ,164 ,175 
signed ranks test, Wilcoxon ( Wilcoxon 符号 秩 
检验 ) ,352 
significance ,level of( 显著 水 平 ) ,99 
simple hypothesis( 简单 假设 ) ,97 
simulation, computer, to find null distribution 
( 求 零 分 布 的 计算 机 模拟 ) ,446 ,447 
simultaneous confidence intervals ( 联合 置信 区 
间 ) ,133 
size of the critical region ( 临界 域 的 大 小 ) ,100 
slope, A. R. E. of rank test for( 斜率 的 A. R. E. 
秩 检验 ) ,342 
slope in linear regression (线性 回归 的 斜 
率 ) ,333 
confidence interval for( 置信 区 间 ) ,335 
testing the( 检验 ) ,335 
Smirnov test( Smirnov 检验 ) ,456 


efficiency of( 效率 ) ,465 
exact tables ( 精确 表 ) ,558-560 
Smirnov-type tests for several samples ( 多 样本 
Smirnov 型 检验 ) ,462 
Spearman’s footrule( Spearman 脚 规则 ) ,331 
Spearman`s rank correlation test ( Spearman FK 
相关 检验 ) ,175 ,316 
A. R. E. of( A. R. E. ) ,327 
exact tables ( 精确 表 ) ,544 
Spearman's rho ( Spearman p ), 314, 325, 
326,335 
for ordered alternatives ( 顺序 备 择 ) ,380 
relationship with Friedman’s test( 与 Fried- 
man 检验 的 关系 ) ,382 
split plots( XIX ) ,385 
SPSS , v ,382 ,390 
squared ranks test for variances ( 方差 的 平方 秩 
检验 ) ,300 
exact tables for( 精确 表 ) ,542-543 
standard deviation( 标准 差 ) ,37 ,38 
estimate of( 估计 ) ,443 
of hypergeometric distribution ( 超 几 何 分 
布 ) ,188 ,191 
population, estimator of ( 总体 估 计 
量 ) ,115 
sample( 样本 ) ,83 
standard error( 标准 差 ) ,85 ,88 
standard normal distribution (标准 正 态 分 
布 ) ,55 
STATA ,v.88 
statistic( 统计 量 ) ,75 ,76 
order( 次 序 ) ,77 ,82 
test( 检验 ) ,35 ,96 ,97 
statistical inference( 统计 推断 ) ,68 
statistics{ 统计 学 ) ,68 
StatMost ,259 
StatXact, 104, 127, 130, 144, 161, 168, 182, 
I89.201,205,210,220,230,241,252,276, 
282 ,290 , 303 , 318 , 322 , 325 , 355 , 361 , 371, 
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375 ,380 , 382 , 387 , 399 , 400 , 401 , 408 , 409 ， 
413 ,432 ,435 ,444 ,451 ,459 
stem and leaf method( 芝 叶 方法 ) ,270 
step function( 阶梯 函数 ) ,52 
stratified samples( 分 层 样 本 ) ,362 
sum of chi-squared random variables( y` 随机 变 
有 量 的 和 ) ,62 
sum of integers formula( 整数 和 公式 ) ,40 
sum of random variables( 随机 变量 的 和 ) : 
mean of( 均值 ) ,39 
variance of( 方差 ) ,48 
sum of ranks( FFI) : 
mean of ( 均值 ) ,41 ,49 
variance of( 方差 ) .48 .49 
sum of squared integers formula( 整数 平方 和 公 
式 ) ,43 
sure event( 必然 事件 ) ,14 
survival curves( 生存 曲线 ) ,119 
survival function( 生存 项 数 ) ,89 
empirical( 经 验 ) ,89 
symmetric distributions{ 对 称 分 布 ) ,350 ,351 
symmetry ,Smirnov test for( Smirnov 对 称 性 检 
验 ) ,465 
symmetry ,tests for( 对 称 性 检验 ) ,364 
SYSTAT ,88 ,91 ,259 


T 
t distribution ,table( t 分 布 , 表 格 ) ,561 
t statistic computed on ranks ( 基于 秩 计算 的 + 
统计 量 ) ,367 
t test(f 检验 ) : 
efficiency of paired( 配对 效率 ) ,364 
one sample( 一 样本 ) ,363 ,418 
paired( 配对 ) ,363 
two sampjle{ 两 样本 ) ,284 ,417 
table ,contingency( 列 联 表 ) ,166 ,179 ,292 
target population( 目标 总 体 ) ,69 ,70 
tau, Kendall’s ( 7, Kendall ) ，318 319, 325, 
326,335 
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test conservative ( 保守 检验 ) ,113 
test hypothesis( 假设 检验 ) ,95 
test ,one tailed( 单 边 检验 ) ,98 
test statistic( 检验 ,统计 量 ) ,35 ,96 ,97 
test ,two tailed( 双边 检验 ) ,98 
test,unbiased( 无 偏 检 验 ) ,106 ,108 ,160 
testing hypotheses( 假设 检验 ) ,95 
tests , consistent sequence of ( 相合 序列 检验 )， 
106 ,108 ,160 
three-way contingency table ( 三 种 方式 列 联 
表 ) ,214 
tolerance limits( 容忍 限 ) , 150 
approximation formulas for( HAR), 
151,155 
exact tables for ( 精确 表 ) ,537 
transformation ,rank( 秩 变 换 ) ,417 
trend( 趋势 ) : 
Cox and Stuart test for ( Cox 和 Stuart 检 
验 ) ,169 ,170 
Daniel's test for( Daniel 检验 ) ,323 
trials( 基本 试验 ) ,6 
Tschuprow’s coefficient( Tschuprow 系数 ) ,232 
two independent samples ,randomization test for 
(两 独立 样本 的 随机 化 检验 ) ,409 
two-sample Cramér-von Mises test (两 样本 
Cramér-von Mises 检验 ) ,463 
two-sample t test( 两 样本 1 检验 ) ,198 
two-tailed test{ IUH t 检验) ,98 
two-way contingency table (两 种 方式 列 联 
表 ) ,214 
type Í error (一 类 错误 ) ,98 
type II error( 二 类 错误 ) ,98 ,99 


U 

unbiased estimator( 无 偏 估 计量 ) ,84 ,94 
unbiased , sign test( 无 偏 , 符 号 检验 ) ,163 
unbiased test( 无 偏 检验 ) ,106 ,108 ,160 
uniform distribution( 均匀 分 布 ) : 


continuous( 连续 ) ,433 
discrete( 离散 ) ,28 ,437 
upper-tailed test( 右边 检验 ) ,98 


V 
value ,expected( 期 望 值 ) ,35 ,39 
van der Waerden test ( van der Waerden 检 
验 ) ,397 
variable ,random( 随机 变量 ) ,22 ,23 ,76 
variance( 方差 ) ,36 ,37 
in binomial distribution( 二 项 分 布 ) ,49 
multiple comparisons for test for ( 检验 的 
多 重 比较 ) ,304 
in rank test using scores (得 分 秩 检 
验 ) ,307 
sample( 样本 ) .81 ,83 
squared ranks test for( 平方 秩 检验 ) ,300 
of sum of random variables ( 随机 变量 的 
和 ) ,48 
of sum of ranks( 秩 和 ) ,48 .49 
tests for( 检验 ) ,309 
variations of the sign test( 符号 检验 的 变 差 )， 
166 ,175 


w 
Walsh test( Walsh 检验 ) ,364 
Wilcoxon signed ranks test( Wilcoxon 符号 秩 检 
验 ) ,164 ,352 ,411 
continuity correction in( 连续 相关 ) ,359 
efficiency of( 效率 ) ,364 
extension to k samples of (推广 到 大 个 样 
本 ) ,367 
normal approximation in ( E $B ir), 
353 ,359 
tables ( 表格 ) ,547-548 
Wilcoxon test( Wilcoxon 检验 ) ,103 
Wilcoxon two-sample test( Wilcoxon 两 样本 检 
验 ) ,271 
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